SW/인공지능

인공지능 : 딥 러닝 : 도전 과제, 극복 과제, 단점

얇은생각 2019. 7. 28. 07:30
반응형

인공지능 : 딥 러닝 : 도전 과제, 극복 과제, 단점


도전 과제

딥 러닝을 위한 새로운 유스 케이스가 밝혀 짐에 따라 해결해야 할 과제도 있습니다.




많은 데이터 필요

"알고리즘을 훈련시키는 데 실제로 얼마나 많은 데이터가 있습니까?"


이것은 딥 러닝 알고리즘을 사용하는 사람들이 가장 자주 묻는 질문입니다. 불행히도 정답은 없지만 원칙적으로 데이터 과학자는 원하는 강력한 추상화를 수행하면 더 많은 데이터가 필요하다고 말합니다.


신경 네트워크의 경우, 훈련에 필요한 데이터의 양은 다른 머신 러닝 알고리즘에 비해 훨씬 더 높습니다. 그 이유는 딥 러닝 알고리즘의 과정은 크게 2가지이기 때문입니다. 첫째, 도메인에 대해 알아야하며 문제를 해결해야합니다. 훈련이 시작되면 알고리즘이 처음부터 시작됩니다. 주어진 도메인에 대해 배우려면, 알고리즘은 튜닝하고 함께 수많은 매개 변수가 필요합니다.


이를 더 잘 이해하려면 인간의 두뇌로서의 딥 러닝 알고리즘을 생각해보십시오. 의사 결정을 내리기 전에 우리 주변의 세계에 관한 정보를 배우고 추론하는 데 많은 경험이 필요합니다. 스토브에 손가락을 대고 뜨거워 지거나 따뜻한 날씨에 눈이 녹아 집에 데려다 주려합니다. 유사하게, 신경망은 데이터 세트를 반복적으로 통과함으로써 주어진 회사의 주가가 증가하거나 감소하는 것에 대해 학습합니다.




딥 러닝의 핵심 신경망은 블랙 박스

딥 러닝의 가장 중요한 한계 중 하나는 신경망이 특정 솔루션에 어떻게 도달 하는지를 이해하지 못한다는 사실입니다.


그것이 어떻게 작동하는지 보기 위해 내부를 들여다 보는 것은 불가능합니다. 인간의 두뇌와 마찬가지로, 신경 회로망의 논리는 수십 개 또는 수백 개의 복잡하게 연결된 레이어로 배열 된 수천 개의 시뮬레이션 된 뉴런의 동작에 포함되어 있습니다.


함께 전체 출력이 생성 될 때까지 한 수준에서 다른 수준으로 입력이 전송되는 복잡한 웹을 형성합니다. 또한 네트워크가 원하는 출력을 더 빨리 생성하는 방법을 배우는 방식으로 개별 뉴런의 계산을 조정하는 역 전파 (back-propagation)라고 알려진 프로세스가 있습니다.


신경망이 큰 결과를 가져 오지만 "사고" 과정에서 투명성이 결여되면 실패가 언제 발생할지를 예측하기가 어렵습니다. 동일한 논증은 또한 프로세스 검증이 중요한 도메인에 적합하지 않게 만듭니다. 한 가지 좋은 예가 의학입니다.


예를 들어, 뉴욕의 마운트 시나이 병원 (Mount Sinai Hospital)에서 700,000 명 이상의 환자 기록에 적용된 딥 러닝 프로그램 인 Deep Patient를 생각해보십시오. 오랜 훈련 기간을 거친 후 Deep Patient는 인간 의사보다 특정 질병을 더 잘 감지 할 수 있었습니다.


한편으로 이것은 좋은 소식입니다. 다른 한편, Deep Patient와 같은 도구가 실제로 의료 인력에게 도움이 될 경우, 예측에 대한 추론을 제공하고, 정확성을 재확인하며, 치료를 정당화 할 필요가 있습니다. 정당화가 없다면 환자의 신뢰를 얻거나 진단의 실수가 있는 이유를 알아 내기가 어렵습니다.




모델 오버피팅

오버피팅은 "훈련 데이터"를 너무 잘 모델링하는 알고리즘을 의미합니다. 즉, 모델을 오버 트레인하는 알고리즘입니다. 실제 시나리오에서 모델의 성능에 부정적인 영향을 미치는 정도까지 알고리즘이 학습 데이터의 세부 사항 및 잡음을 학습하면 오버피팅이 발생합니다.


오버피팅은 신경망에서 주요한 문제입니다. 이는 종종 매우 많은 수의 매개 변수를 갖고 그에 따라 많은 "노이즈"를 갖는 최신 네트워크에서 특히 발생합니다.


모델이 오버피팅인지 어떻게 알 수 있습니까? 일정한 수의 훈련 이후 정확도가 개선되지 않으면 오버피팅일 확률이 높습니다.


인공지능 : 딥 러닝 : 도전 과제, 극복 과제, 단점


 

위의 그림에서 우리는 정확도가 약 275 번째 시대 후에 증가하지 않지만 약 82.15 %와 82.25 % 사이에서만 변동한다는 것을 알 수 있습니다. 아마도 이것은 모델이 275 번째 시대 이후에 과도하게 훈련되고 있음을 의미합니다.




유연성 부족

인공 지능이 세계를 점령한다는 경고에도 불구하고 딥 러닝 알고리즘은 그 성격상 매우 단순합니다. 주어진 문제를 해결하기 위해서는 딥 러닝 네트워크에 특정 문제를 설명하는 데이터를 제공해야 하므로 알고리즘으로 문제를 해결하는 데 비효율적으로 만듭니다. 이것은 원래의 문제와 얼마나 유사하든 상관 없습니다.


치와와와 머핀을 구별하는 딥 러닝 알고리즘의 간단한 예를 살펴 보겠습니다.


인공지능 : 딥 러닝 : 도전 과제, 극복 과제, 단점

 

이 알고리즘은 작은 개과 머핀을 구별하는 데 성공했지만, 비슷한 종류의 음식과 개를 구별하면 동일한 알고리즘이 결과가 좋지 않을 가능성이 높습니다.




결론

위에 제시된 요점은 딥 러닝이 많은 잠재력을 가지고 있음을 보여 주지만 좀 더 다양한 도구가 되기 전에 몇 가지 문제를 극복해야합니다. 그러나 분야에 대한 관심과 열정이 커지고 있으며, 오늘날 우리는 이 기술에 대한 놀라운 실제 적용 사례를보고 있습니다.


물론 Siri와 Cortana의 도움 목소리, Google Photos의 태깅 기능, Grammarly의 교정자 및 Spotify의 음악 추천과 같은 소비자 관련 응용 프로그램이 많이 있습니다.


그러나 비즈니스 세계에서는 딥 러닝의 더 큰 영향을 발견 할 수 있습니다.


딥 러닝 알고리즘은 CRM 시스템, 소셜 미디어 및 기타 온라인 데이터의 고객 데이터에 적용되어 고객을 보다 잘 분류하고 이탈을 예측하고 사기를 탐지합니다. 금융 업계는 주가 예측을 제공하고 적시에 거래를 수행하기 위한 딥 러닝에 점점 더 의존하고 있습니다. 의료 산업에서 딥 러닝 네트워크는 새로운 질병에 대항하여 사용하기 위해 알려지고 테스트된 약물을 용도 변경하여 일반 대중이 이용할 수 있게 되기까지의 시간을 단축 할 수 있는 가능성을 모색하고 있습니다.


또한 정부 기관은 위성 이미지를 분석하여 식량 생산 및 에너지 인프라와 같은 통계에 대한 실시간 통찰력을 얻는 데 도움이 되도록 딥 러닝을 사용하고 있습니다.


한 가지 분명한 사실은, 유익한 사례와 딥 러닝을 감안할 때, 이 기술을 더욱 완벽하게 만들기 위해 대규모 투자가 이루어질 것이고 미래에 해결해야 할 현재의 과제가 점점 더 많아 질 것으로 기대합니다.

반응형