SW/인공지능

인공지능 : 뉴럴 네트워크(신경망) 개념, 원리, 종류

얇은생각 2019. 5. 16. 07:30
반응형

인공지능 : 뉴럴 네트워크



신경망?

신경망은 인간의 뇌를 본따서 스스로 모델을 만드는 머신러닝의 한 종류입니다. 이것은 알고리즘을 통해 컴퓨터가 새로운 데이터를 통합함으로써 학습할 수 있는 인공 신경망을 만듭니다.


요즘 인공지능 알고리즘이 풍부하지만, 신경망은 이른바 '딥러닝'을 수행할 수 있습니다. 뇌의 기본 단위가 뉴런인 반면, 인공 신경망의 필수적인 구성 단위는 단순한 신호 처리를 수행하는 지각변동체이며, 그런 다음 이것들은 큰 메쉬 네트워크로 연결됩니다.


신경망이 있는 컴퓨터는 이전에 미리 라벨을 붙였던 훈련 예를 분석하게 하여, 과제를 하도록 가르칩니다. 딥러닝을 이용한 신경망의 업무의 일반적인 예는 객체 인식 작업인데, 여기서 신경 네트워크는 고양이, 거리 표지 등 특정 유형의 많은 물체를 제시하고, 컴퓨터는 제시된 영상에서 반복되는 패턴을 분석하여 새로운 영상을 분류하는 것을 배웁니다.




신경 네트워크가 어떻게 학습하는지?

다른 알고리즘과 달리, 딥 러닝이 있는 신경 네트워크는 그 작업을 위해 직접 프로그래밍할 수 없습니다. 오히려, 아이들이 두뇌를 발달시키는 것처럼, 정보를 배워야 한다는 요구 조건을 가지고 있습니다. 학습 전략은 다음과 같은 세 가지 방법으로 진행됩니다.


감독 학습(supervised) : 이 학습 전략은 가장 간단합니다. 컴퓨터가 통과하는 라벨 데이터 세트가 있고, 알고리즘이 원하는 결과를 얻기 위해 데이터 세트를 처리할 수 있을 때까지 수정됩니다.


비감독 학습(unsupervised) : 이 전략은 레이블이 지정된 데이터 세트가 없는 경우 사용할 수 있습니다. 신경 네트워크는 데이터 세트를 분석하고, 그리고 나서 비용 함수는 그것이 목표치로부터 얼마나 멀리 떨어져 있었는지 신경 네트워크에 알려줍니다. 그런 다음 신경 네트워크는 알고리즘의 정확도를 높이기 위해 조정됩니다.


강화 학습 : 이 알고리즘에서는, 긍정적인 결과는 신경망을 강화시키고, 부정적인 결과는 처벌함으로써, 신경 네트워크가 시간이 지남에 따라 학습하도록 강요합니다.




실제 세계는 신경망을 사용

필기 인식은 인공 신경망을 통해 접근할 수 있는 실제 세계의 문제입니다. 인간이 단순한 직관으로 필기를 인식하는 것은 어렵습니다. 따라서 컴퓨터 역시 각 개인의 필체가 독특하고 스타일이 다르고 글자 간 간격도 달라서 일관성 있게 알아보기 어렵다는 것입니다.


예를 들어, 첫 번째 글자인 대문자 A는 두 글자가 꼭대기에서 만나는 세 개의 직선으로 묘사될 수 있고, 가로지르는 직선은 만나는 두 직선에 중간쯤에 있는 것이 이치에 맞는 것이지만, 이것을 컴퓨터 알고리즘으로 표현하는 것은 도전입니다. 


인공신경망 접근법을 통해 컴퓨터는 이전에 어떤 문자나 숫자에 해당하는지 라벨을 붙인 것으로 알려진 손으로 쓴 글자의 훈련 예를 전달받습니다. 그리고 알고리즘을 통해 컴퓨터는 각 문자를 인식하는 법을 배웁니다. 그리고 문자들의 데이터 세트가 증가함에 따라 정확성도 증가합니다. 필기 인식은 우편 서비스에서 서신에 대한 자동 주소 읽기만큼 다양한 응용프로그램을 갖추고 있어 수표에 대한 은행 부정 행위를 줄이고 펜 기반 컴퓨팅에 대한 문자 입력에 이르기까지 다양합니다.




노트북 화면의 재무 데이터

인공신경망의 또 다른 문제는 금융시장 예측입니다. 이는 '알고리즘 트레이딩'라는 용어로도 통하며, 주식시장, 상품, 금리, 다양한 통화 등 모든 유형의 금융시장에 적용됐습니다. 주식시장의 경우 거래자들이 신경망 알고리즘을 이용해 저평가된 주식을 찾아내고, 기존 주식 모델을 개선하며, 시장이 변함에 따라 알고리즘을 최적화하기 위해 심층 학습 측면을 활용합니다. 예를 들어 MJ Trading Systems와 같은 신경망 주식 거래 알고리즘을 전문으로 하는 회사들이 있습니다.


인공신경망 알고리즘은 고유의 유연성을 가지고, 복잡한 패턴 인식과 예측 문제에도 계속 적용되고 있습니다. 위의 예 외에도, 소셜 미디어 이미지의 얼굴 인식, 의료 이미지의 암 검지 및 비즈니스 예측과 같은 다양한 애플리케이션이 포함됩니다.

반응형