SW/머신러닝

머신러닝 : 역사, 개념, 종류에 대해 알아보기

얇은생각 2019. 12. 26. 07:30
반응형

머신러닝의 역사

머신 러닝은 데이터 속에 숨어있는 규칙적인 패턴을 찾아냅니다. 그 다음 다양한 수리적 형태(함수, 규칙, 그래프 모델 등)로 표현하는 목적을 가진 연구 분야입니다. 

머신 러닝은 여러 분야에 걸친 학문입니다. 예륵 들어 Artificial Intelligence, Probability and Statistics, Computational Complexity Theory, Control Theory, Information Theory, Philosophy, Psychology, Neurobiology 등이 있습니다. 

 

 

머신 러닝이란

공학에서 y = f(x)가 주어진다면, 머신 러닝에서는 주어진 데이터로부터 함수 f를 찾는 것입니다. 

y는 출력 변수로 반응 변수, 종속 변수로 불리기도 합니다.

x는 입력 변수로 예측 변수, 독립 변수로 불리기도 합니다. 

 

 

머신 러닝의 종류

지도 학습 (supervised learning)

출력 변수가 존재하여 입력 변수와 출력 변수 사이의 관계인 f를 추정하는 데에 초점을 맞춥니다. 크게 회귀와 분류로 나누어 집니다.

회귀(regression)는 입력 변수 x에 대해서 연속형 출력 변수 y를 예측합니다.

분류(classification)은 입력 변수 x에 대해서 이산형 출력 변수 y(class)를 예측합니다. 

 

 

비지도 학습

출력 변수가 존재하지 않고, 입력 변수 간의 관계에 초점을 맞춥니다. 비지도 학습의 대표적인 예로는 입력 변수 값이 유사한 데이터 끼리 그룹핑 해주는 군집 분석(cluster analysis)가 있습니다. 또 입력 변수의 차원을 축소하는 PCA(principal component analysis), 트랜잭션(transaction)에 있는 아이템들 간의 연관 관계를 분석해주는 Apriori 연관성 분석 등이 있습니다. 

군진 분석 예

반응형