반응형
모형의 적합성을 평가하는 방법
모형의 복잡도에 따른 학습 집합의 MSE(회색)와 검증 집합의 MSE(빨간색)의 변화를 위 그림을 통해 알아보았습니다. 학습 집합의 MSE는 복잡한 모형일수록 감소합니다. 학습 데이터가 아닌 또 다른 데이터 (검증 데이터)의 MSE는 일정 시점 이후로 증가합니다.
증가하는 원인은 왼쪽 그림에 초록색처럼 학습 집합에 과적합되기 때문입니다. 그렇다면, 각 색깔마다 어떠한 결과가 나왔는 지 알아보도록 하였습니다.
검은색 : 실제 f를 나타내는 모형입니다.
노란색 : 가장 낮은 복잡도를 가지므로 편파성이 높아져 가장 높은 MSE 값을 가집니다.
초록색 : 가장 높은 복잡도를 가지므로 학습 집합에 과적합되어 있습니다. 분산이 높아집니다. 따라서, 검증 데이터의 MSE가 하늘색에 비해 상승합니다.
하늘색 : 검은색 모형과 가장 유사한 형태입니다. 분산과 편파성이 모두 적절히 낮아져 검증 데이터의 MSE가 가장 낮습니다.
반응형
'SW > 머신러닝' 카테고리의 다른 글
머신러닝 : k-Fold 교차 검증 (k-Fold Cross Validation) : 개념, 방식 (0) | 2020.01.15 |
---|---|
머신러닝 : 데이터 분할 : 방법, 방식, 절차 (0) | 2020.01.14 |
머신러닝 : 분산(variance)과 편파성(Bias)의 딜레마 (0) | 2020.01.12 |
머신러닝 : 데이터셋 , 과적합(오버피팅) : 개념, 팁, 의미, 개요 (0) | 2020.01.07 |
머신러닝 : 표본 공분산, 상관 계수 : 개념, 공식, 의미 (1) | 2020.01.06 |