SW/인공지능

인공지능 : 핵심기술 (7) : 이미지 인식

얇은생각 2019. 4. 18. 12:30
반응형



이미지 인식이란?

이미지 인식은 컴퓨터 비전의 메커니즘이지만 컴퓨터 비전은 AI의 한 분야입니다.


인공 지능은 인간의 특성을 복사하고 일반적으로 인간의 지능이 필요한 작업을 수행 할 수있는 컴퓨터 시스템입니다.


설득력있는 인공 지능을 만들기 위해서는 "컴퓨터 비전"이 ​​필요합니다. 컴퓨터가 시각적 단서에서 주로 나오는 데이터를 수집, 처리 및 분석 할 수 있지만 열 센서, 초음파 등과 같은 유사한 출처의 데이터도 포함될 수 있습니다.


요컨대, 컴퓨터 비전은 기계가 "볼"수 있게 해줍니다. 때로는 인간이 할 수 없는 일도 있습니다. 예를 들어 미국 피츠버그에있는 Carnegie Mellon University는 실제로 "Breathe Cam"이라는 컴퓨터 비전 응용 프로그램을 개발하고 있습니다. 4 대의 클라우드 연결 카메라가 장착되어있어 사용자가 호흡하는 대기 오염을 모니터링하고 문서화 할 수 있으며 소스로 추적 할 수도 있습니다.


그러나 인간이 할 수 없는 일을 하기 위해서 인간이 할 수있는 것으로부터 시작해야합니다. 즉, 대상과 생물을 보고 라벨을 붙이는 것이 이미지 인식의 주요 기능입니다.


Google 두뇌 팀이 만든 오픈 소스 소프트웨어 라이브러리인 Tensorflow는 이미지 인식을 컴퓨터가 사진이나 비디오를 픽셀 단위로 분해하고 이미지의 내용을 "확인"하기 위해 모양의 패턴을 인식하며, 그들을 분류했습니다. 


예를 들어, 주식 웹 사이트는 매일 수백만 개의 그림과 수십억 개의 검색으로 연료를 공급받습니다. 일반적으로 웹 사이트의 제공자는 사용자의 검색어와 일치시키기 위해 업로드하는 모든 사진 하나에 태그와 설명을 추가해야합니다. 이미지 인식 기능을 설치하면 이미지가 서버로 전송되자마자 기기가 자동으로 누가 누군지, 무엇이 무엇인지를 인식 할 수 있습니다. 그런 다음 검색 엔진을 최적화하고 사용자 경험을 증폭시키는 방법보다 자세한 정보를 설명으로 채울 수 있습니다.

반응형