머신러닝 : 모형의 적합성 : 평가 방법

SW/머신러닝

얇은생각 2020. 1. 13. 07:30

모형의 복잡도에 따른 학습 집합의 MSE(회색)와 검증 집합의 MSE(빨간색)의 변화를 위 그림을 통해 알아보았습니다. 학습 집합의 MSE는 복잡한 모형일수록 감소합니다. 학습 데이터가 아닌 또 다른 데이터 (검증 데이터)의 MSE는 일정 시점 이후로 증가합니다.

증가하는 원인은 왼쪽 그림에 초록색처럼 학습 집합에 과적합되기 때문입니다. 그렇다면, 각 색깔마다 어떠한 결과가 나왔는 지 알아보도록 하였습니다.

검은색 : 실제 f를 나타내는 모형입니다.

노란색 : 가장 낮은 복잡도를 가지므로 편파성이 높아져 가장 높은 MSE 값을 가집니다.

초록색 : 가장 높은 복잡도를 가지므로 학습 집합에 과적합되어 있습니다. 분산이 높아집니다. 따라서, 검증 데이터의 MSE가 하늘색에 비해 상승합니다.

하늘색 : 검은색 모형과 가장 유사한 형태입니다. 분산과 편파성이 모두 적절히 낮아져 검증 데이터의 MSE가 가장 낮습니다.

머신러닝 : k-Fold 교차 검증 (k-Fold Cross Validation) : 개념, 방식 (0)	2020.01.15
머신러닝 : 데이터 분할 : 방법, 방식, 절차 (0)	2020.01.14
머신러닝 : 분산(variance)과 편파성(Bias)의 딜레마 (0)	2020.01.12
머신러닝 : 데이터셋 , 과적합(오버피팅) : 개념, 팁, 의미, 개요 (0)	2020.01.07
머신러닝 : 표본 공분산, 상관 계수 : 개념, 공식, 의미 (1)	2020.01.06

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

쵸코쿠키의 연습장