SW/머신러닝

머신러닝 : 모형의 적합성 : 평가 방법

얇은생각 2020. 1. 13. 07:30
반응형

모형의 적합성을 평가하는 방법

 

Mean Squared Error (MSE)

 

모형의 복잡도에 따른 학습 집합의 MSE(회색)와 검증 집합의 MSE(빨간색)의 변화를 위 그림을 통해 알아보았습니다. 학습 집합의 MSE는 복잡한 모형일수록 감소합니다. 학습 데이터가 아닌 또 다른 데이터 (검증 데이터)의 MSE는 일정 시점 이후로 증가합니다. 

증가하는 원인은 왼쪽 그림에 초록색처럼 학습 집합에 과적합되기 때문입니다. 그렇다면, 각 색깔마다 어떠한 결과가 나왔는 지 알아보도록 하였습니다. 

 

검은색 : 실제 f를 나타내는 모형입니다.

노란색 : 가장 낮은 복잡도를 가지므로 편파성이 높아져 가장 높은 MSE 값을 가집니다.

초록색 : 가장 높은 복잡도를 가지므로 학습 집합에 과적합되어 있습니다. 분산이 높아집니다. 따라서, 검증 데이터의 MSE가 하늘색에 비해 상승합니다.

하늘색 : 검은색 모형과 가장 유사한 형태입니다. 분산과 편파성이 모두 적절히 낮아져 검증 데이터의 MSE가 가장 낮습니다.

반응형