SW/추천시스템

추천 시스템 : 정확도 지표 (RMSE, MAE) : 개념, 방법

얇은생각 2020. 7. 30. 07:30
반응형

Mean Absolute Error(MAE)

 

추천 시스템 : 정확도 지표 (RMSE, MAE) : 개념, 방법

 

가장 간단한 측정법은 절대 오차 또는 MAE를 의미합니다. 여기에는 계산 방법에 대한 공상적이고 수학적인 방정식이 있습니다. 외관상 그렇게 복잡하지는 않으므로 분해해보겠습니다. 

테스트 세트에 N 개의 등급이 있다고 가정합니다. 각 평가에 대해 평가 또는 시스템 예측 y를 호출하고 사용자가 실제로 부여한 평가 x를 평가할 수 있습니다.

두 평가 사이의 차이의 절대 값을 취하여 해당 평가 예측에 대한 오차를 측정합니다. 테스트 세트의 모든 n 등급에 걸쳐 이러한 오류를 합산하고 평균을 얻기 위해 나눈 값으로 나눕니다. 따라서 절대 오차는 정확히, 즉, 예측에서 각 오차의 평균 또는 평균 절대 값입니다.

오류가 나쁘므로 최고 점수가 아닌 최저 MAE 점수를 원합니다. 간단한 예를 보도록하겠습니다. 테스트 세트에 4 개의 등급이 있다고 가정 해 보겠습니다. 실제 등급은 3입니다. 이 경우 절대 오차는 2입니다. 모든 등급에 대해 모두 합산하고 4로 나눕니다. 이 경우 MAE 점수는 1.5입니다.

 

 

 

Root Mean Square Error (RMSE)

 

추천 시스템 : 정확도 지표 (RMSE, MAE) : 개념, 방법

 

정확도를 측정하는 방법은 근 평균 제곱 오차 또는 RMSE입니다. 이 방법은 몇 가지 이유로 더 널리 사용되는 메트릭이지만, 등급 예측이 어려울 때 벌칙을 부과하고 합리적으로 가까이 있을 때 상점을 부과합니다.

각 등급 예측 오차의 절대 값을 합산하는 대신 등급 예측 오차의 제곱을 합산합니다. 제곱을 취하면 절대 값과 마찬가지로 양수로 끝나고 더 큰 오차에 대한 벌점을 부풀립니다. 완료되면 제곱근을 사용하여 의미있는 숫자로 돌아갑니다.

다시 말하지만, 메트릭의 이름을 그대로 사용할 수 있습니다. Root는 완료했을 때 모든 것의 제곱근을 취한다는 것을 의미합니다. e는 각각의 개별 평가 예측 오차의 제곱을 의미합니다.

위와 같은 예제를 보겠습니다. 테스트 세트의 첫 번째 평가에서 예측 된 점수 5와 실제 평가 3 사이의 오차는 2이며, 오차의 제곱은 4입니다. 테스트 세트의 각 등급에 대해 이를 수행하고 모두 합산 한 다음 등급 수로 나누고 제곱근을 취하면 이번에는 1.87로 끝납니다.

이 동일한 데이터의 MAE 점수가 1.5로 더 높다고 할 수 있습니다. RMSE가 높을수록 나쁘고 높은 점수가 아닌 낮은 오류 점수가 되어야 합니다. 정확도는 실제로 측정하는 것은 아닙니다. 

 

 

정리

 

추천 시스템 : 정확도 지표 (RMSE, MAE) : 개념, 방법

 

추천 시스템이 우리가 볼 수 있는 최고의 영화에 대해 어떻게 생각하는지는 매우 다른 문제입니다. 그래서 추천 시스템 연구 분야의 정확성과 RMSE 점수에 중점을 두는 방법은 무엇인지 알아야 합니다.

Netflix가 첫 번째로 개인 또는 그룹에게 백만 달러의 상금을 제공하여 공개된 영화 Rank 데이터 세트에서 Netflix의 RMSE 점수를 10% 향상시킬 때 Netflix 상이라고 불렸으며, 이 백만 달러의 상금은 많은 연구를 촉발했습니다.

추천 시스템은 RMSE 점수가 낮으면 되기 때문에 모든 사람이 중점을 두었으며 지금까지도 시간이 지남에 따라 그 초점이 파급되었습니다.

반응형