Mean Absolute Error(MAE)
가장 간단한 측정법은 절대 오차 또는 MAE를 의미합니다. 여기에는 계산 방법에 대한 공상적이고 수학적인 방정식이 있습니다. 외관상 그렇게 복잡하지는 않으므로 분해해보겠습니다.
테스트 세트에 N 개의 등급이 있다고 가정합니다. 각 평가에 대해 평가 또는 시스템 예측 y를 호출하고 사용자가 실제로 부여한 평가 x를 평가할 수 있습니다.
두 평가 사이의 차이의 절대 값을 취하여 해당 평가 예측에 대한 오차를 측정합니다. 테스트 세트의 모든 n 등급에 걸쳐 이러한 오류를 합산하고 평균을 얻기 위해 나눈 값으로 나눕니다. 따라서 절대 오차는 정확히, 즉, 예측에서 각 오차의 평균 또는 평균 절대 값입니다.
오류가 나쁘므로 최고 점수가 아닌 최저 MAE 점수를 원합니다. 간단한 예를 보도록하겠습니다. 테스트 세트에 4 개의 등급이 있다고 가정 해 보겠습니다. 실제 등급은 3입니다. 이 경우 절대 오차는 2입니다. 모든 등급에 대해 모두 합산하고 4로 나눕니다. 이 경우 MAE 점수는 1.5입니다.
Root Mean Square Error (RMSE)
정확도를 측정하는 방법은 근 평균 제곱 오차 또는 RMSE입니다. 이 방법은 몇 가지 이유로 더 널리 사용되는 메트릭이지만, 등급 예측이 어려울 때 벌칙을 부과하고 합리적으로 가까이 있을 때 상점을 부과합니다.
각 등급 예측 오차의 절대 값을 합산하는 대신 등급 예측 오차의 제곱을 합산합니다. 제곱을 취하면 절대 값과 마찬가지로 양수로 끝나고 더 큰 오차에 대한 벌점을 부풀립니다. 완료되면 제곱근을 사용하여 의미있는 숫자로 돌아갑니다.
다시 말하지만, 메트릭의 이름을 그대로 사용할 수 있습니다. Root는 완료했을 때 모든 것의 제곱근을 취한다는 것을 의미합니다. e는 각각의 개별 평가 예측 오차의 제곱을 의미합니다.
위와 같은 예제를 보겠습니다. 테스트 세트의 첫 번째 평가에서 예측 된 점수 5와 실제 평가 3 사이의 오차는 2이며, 오차의 제곱은 4입니다. 테스트 세트의 각 등급에 대해 이를 수행하고 모두 합산 한 다음 등급 수로 나누고 제곱근을 취하면 이번에는 1.87로 끝납니다.
이 동일한 데이터의 MAE 점수가 1.5로 더 높다고 할 수 있습니다. RMSE가 높을수록 나쁘고 높은 점수가 아닌 낮은 오류 점수가 되어야 합니다. 정확도는 실제로 측정하는 것은 아닙니다.
정리
추천 시스템이 우리가 볼 수 있는 최고의 영화에 대해 어떻게 생각하는지는 매우 다른 문제입니다. 그래서 추천 시스템 연구 분야의 정확성과 RMSE 점수에 중점을 두는 방법은 무엇인지 알아야 합니다.
Netflix가 첫 번째로 개인 또는 그룹에게 백만 달러의 상금을 제공하여 공개된 영화 Rank 데이터 세트에서 Netflix의 RMSE 점수를 10% 향상시킬 때 Netflix 상이라고 불렸으며, 이 백만 달러의 상금은 많은 연구를 촉발했습니다.
추천 시스템은 RMSE 점수가 낮으면 되기 때문에 모든 사람이 중점을 두었으며 지금까지도 시간이 지남에 따라 그 초점이 파급되었습니다.
'SW > 추천시스템' 카테고리의 다른 글
추천 시스템 : Top-N Hit Rate (적중률) : 종류, 방법 (0) | 2020.08.03 |
---|---|
추천 시스템 : Train/Test and Cross Validation : 훈련, 검증 방법 (0) | 2020.07.27 |
추천 시스템 : Top-N Recommender 아키텍처 (0) | 2020.07.26 |
추천시스템 : 암시적 및 명시적 평가를 통한 추천 시스템에 대한 이해 (0) | 2020.07.22 |
추천 시스템 : 추천 시스템의 종류 (0) | 2020.07.18 |