제품 매니저와 머신 러닝으로 무엇을 만들고 싶으면 마음에 두셔야 할 목록입니다.
데이터 과학보다 엔지니어링을 우선
기계 학습 프로젝트는 무엇보다도 소프트웨어 프로젝트입니다. 많은 데이터 과학자가 제대로 설계되고, 안정적이며, 구축하기 쉬운 소프트웨어를 구축한 경험이 거의 없습니다. 생산 시스템을 구축하면 문제가 됩니다.
일반적으로 엔지니어는 데이터 과학자가 엔지니어링 경험을 습득하는 것보다 더 빨리 데이터 과학 기술을 습득할 수 있습니다. 데이터 과학 박사 학위가 비즈니스 애플리케이션 구축에 처음으로 착수하는 대신 5년 이상의 경험과 AI에 대한 열정을 가진 Python 엔지니어와 협력해야 합니다.
구조화
위험을 초기에 줄이는 것이 중요합니다. 프로젝트를 구체적인 이정표로 구조화합니다.
- 시제품 제작 완료 : 귀하의 아이디어가 1일 2주 동안 유망한지 확인합니다.
- 오프라인 테스트 시스템 : 모델을 조정하고 기존 데이터에서 2-4주 동안 엄격하게 테스트합니다.
- 온라인 테스트 시스템 : 모델을 완성하고 2~4주 동안 테스트합니다.
- 진행 중 : 데이터 업데이트, 모델 교육 및 코드 구현을 2~4주 동안 자동화합니다.
- 지속적인 개선: (선택사항) 12개월입니다.
- 총 연대표: 1~3개월입니다.
경험이 풍부한 팀은 거의 모든 프로젝트에 대해 이러한 일정을 따를 수 있어야 합니다. 팀이 1~3개월 내에 시스템 설정에 집중할 수 있습니다. 설정이 끝난 후, 더 많은 개선이 필요한지 여부를 결정하세요.
이러한 유혹은 불필요하게 프로젝트를 연장할 수 있습니다.
- 완벽한 데이터를 요구합니다.
- 잘못된 도구를 사용합니다(너무 복잡하거나 너무 느림).
- 확장성을 위한 Overengineering입니다.
- 알고리즘을 완벽하게 활용합니다(다음 사항 참조)
알고리즘은 중요하지 않습니다.
기계 학습 시스템에는 가지고 놀 수 있는 많은 매력적인 도구들이 있습니다.
따라서 제시하는 사항은 (중요도 순서에 따라) 시간을 할애할 가치가 있습니다.
- 더 많은 (관련된) 입력 데이터를 가져옵니다.
- 데이터를 더 나은 방식으로 사전 처리합니다.
- 올바른 알고리즘을 선택하고 올바르게 조정합니다.
알고리즘은 가장 중요한 요소입니다. 작동하는 알고리즘을 선택하기만 하면 됩니다. 알고리즘을 지속적으로 업그레이드하는 것은 매력적이지만, 기대한 결과를 가져오지 못할 수도 있습니다.
소통
가능한 많은 비즈니스 컨텍스트를 공유합니다.
일단 엔지니어링 팀이 만들어지면, 그들은 많은 선택을 해야 합니다. 그들이 우선순위를 잘 알수록 더 많은 올바른 결정을 내릴 수 있습니다. 최소한 다음 사항에 대해서는 알아야 합니다.
전략적 우선순위
고치는 것이 중요한 문제인가요? 하루에 수백만 건의 요청에도 효과가 있을까요? 아니면 미래 제품에 대한 연구일까요?
현재 프로세스에 문제
현재 공정이 너무 오래 걸립니까? 너무 부정확한 건가요? 아니면 기계 학습 없이는 도저히 고려할 수 없는 데이터가 많이 있을까요?
입력 및 출력
입력: 올바른 결정을 내리기 위해 어떤 데이터를 사용하겠습니까?
출력: 누가 출력을 사용합니까? 얼마나 자주요? 실시간으로 해야 하나요?
성능 측정
가장 중요한 측정 지표는 무엇입니까? 클릭율? 매출? ROI? 정확성?
정확도가 필요
변환 속도를 최적화하려면 2주 동안 튜닝할 필요가 없을 수 있습니다. 하지만, 의료 진단 시스템을 구축하면 1%라도 잘못된 판단은 허용되지 않을 수 있습니다.
'SW > 인공지능' 카테고리의 다른 글
인공지능 : 응용과 이슈 (2) : AI 솔루션 구현, 운영, 적용 방법 (0) | 2019.04.26 |
---|---|
인공지능 : 응용과 이슈 (1) : AlphaGo의 작동 방식 (0) | 2019.04.25 |
인공지능 : 핵심기술 (11) : 언어 번역 ( 작동, 방식, 원리 ) (0) | 2019.04.22 |
인공지능 : 핵심기술 (10) : 이미지 인식의 장벽, 한계 (0) | 2019.04.21 |
인공지능 : 핵심기술 (9) : 이미지 학습에 투자해야 하는 이유 (0) | 2019.04.20 |