SW/Python

머신 러닝 : 파이썬 플랫폼 종류 및 소개

얇은생각 2019. 9. 14. 07:30
반응형

머신 러닝 라이브러리 요청 순위

 

기계 학습

 

SciKit-Learn

Scikits는 이미지 처리 및 머신 러닝 촉진과 같은 특정 기능을 위해 설계된 SciPy Stack의 추가 패키지입니다. 후자의 경우 가장 두드러진 패키지 중 하나는 scikit-learn입니다. 이 패키지는 SciPy 위에 구축되었으며 수학 연산을 많이 사용합니다.

scikit-learn 패키지는 일반적인 머신 러닝 알고리즘에 간결하고 일관된 인터페이스를 제공하므로 ML을 프로덕션 시스템으로 간단하게 가져올 수 있습니다. 이 라이브러리는 양질의 코드와 우수한 문서화, 사용 편의성 및 고성능을 결합하며, 실제로 Python을 사용한 머신 러닝의 산업 표준입니다.

 

딥 러닝

 

딥 러닝에서 가장 두드러지고 편리한 Python 라이브러리 중 하나는 Keras로, TensorFlow 또는 Theano에서 작동 할 수 있습니다. 그들 모두에 대한 몇 가지 세부 사항을 논의해 보겠습니다. 

Theano

먼저 Theano에 대해 이야기 해 봅시다.

 

Theano는 수학 연산 및 표현식과 함께 NumPy와 유사한 다차원 배열을 정의하는 Python 패키지입니다. 라이브러리는 컴파일되어 모든 아키텍처에서 효율적으로 실행됩니다. 원래 Montréal Université de Montréal의 기계 학습 그룹에서 개발한 이 도구는 주로 기계 학습 응용 프로그램에 사용됩니다.

주목할 점은 Theano가 저수준 작업에서 NumPy와 긴밀하게 통합된다는 것입니다. 또한 이 라이브러리는 GPU 및 CPU 사용을 최적화하여 데이터 집약적인 계산 성능을 더욱 빠르게합니다.

효율성과 안정성 조정을 통해 매우 작은 값으로 훨씬 더 정확한 결과를 얻을 수 있습니다. 예를 들어, log (1 + x)의 계산은 가장 작은 x 값에 대해서도 인지 결과를 제공합니다.


TensorFlow

Google 개발자가 제공하는 TensorFlow는 데이터 흐름 그래프 계산의 오픈 소스 라이브러리로 머신 러닝을 위해 더욱 향상되었습니다. 신경망 교육을위한 Google 환경의 높은 요구 사항을 충족 시키도록 설계되었으며 신경망 기반의 머신 러닝 시스템 인 DistBelief의 후속 제품입니다. 그러나 TensorFlow는 Google의 경계에서 과학적으로 사용하기 위해 엄격하게 사용되는 것은 아니며 다양한 실제 응용 프로그램에서 사용하기에 충분합니다.

TensorFlow의 주요 기능은 대용량 데이터 세트에서 인공 신경망을 빠르게 훈련시킬 수있는 다층 노드 시스템입니다. 이를 통해 사진에서 Google의 음성 인식 및 물체 식별이 가능합니다.


Keras

마지막으로 Keras를 살펴 보겠습니다. Keras는 신경망을 높은 수준으로 구축하기위한 오픈 소스 라이브러리이며 Python으로 작성되었습니다. 높은 수준의 확장성으로 최소화되고 간단합니다. 백엔드에서 Theano 또는 TensorFlow를 사용하지만 Microsoft는 CNTK (Microsoft Cognitive Toolkit)를 새로운 백엔드로 통합하기 위해 노력하고 있습니다.

Keras의 미니멀리즘 디자인은 소형 시스템 구축을 통한 빠르고 쉬운 실험을 목표로 합니다.

Keras는 실제로 시작하기 쉽고 프로토 타입을 빠르게 만듭니다. 순수한 파이썬으로 작성되었으며 본질적으로 높은 수준입니다. 모듈식이며 확장성이 뛰어납니다. 용이성, 단순성 및 높은 수준의 방향에도 불구하고 Keras는 여전히 심각한 모델링을 수행할 수 있을 정도로 깊고 강력합니다.

Keras의 일반적인 아이디어는 레이어를 기반으로 하며 그 외 모든 것은 구축됩니다. 데이터는 텐서로 준비됩니다. 첫 번째 레이어는 텐서의 입력을 담당하고 마지막 레이어는 출력을 담당하며 모델은 그 사이에 내장됩니다.

딥 러닝은 2016 년에 실제로 시작되었고이 세 가지 Python 라이브러리에 대한 트래픽도 증가했습니다. TensorFlow가 가장 인기있는 것으로 나타났습니다. 출처 : Google 트렌드.


비슷한 시간 프레임에서 TensorFlow의 GitHub 풀 요청도 크게 증가했습니다. 그 사이에 scikit-learn에 대한 기여는 평준화되었습니다.

반응형