본문 바로가기

SW/추천시스템

추천 시스템 : Top-N Hit Rate (적중률) : 종류, 방법 Evaluating top-n recommenders Netflix는 최상위 추천에 더 중점을 둔 메트릭을 기반으로 했을 수 있습니다. user stop-end 추천 중 하나가 실제로 등급이 지정된 경우, hit를 고려할 수 있습니다. Hit rate = hits / users 실제로 사용자가 스스로 볼 수 있을 정도로 흥미로운 것을 사용자에게 보여 주었으므로 테스트 세트의 모든 사용자에 대한 최고 추천에 모든 적중을 합산하여 사용자 수로 나눈 후에 적중률입니다. 적중률 자체는 이해하기 쉽지고 측정하면됩니다. 개별 등급의 정확도를 측정하지 않기 때문에 정확도에 사용했던 것과 동일한 train test cross validation 검증 방법을 사용할 수 없으며, 개별 사용자를 위한 최고 추천 목록의 정확..
추천 시스템 : 정확도 지표 (RMSE, MAE) : 개념, 방법 Mean Absolute Error(MAE) 가장 간단한 측정법은 절대 오차 또는 MAE를 의미합니다. 여기에는 계산 방법에 대한 공상적이고 수학적인 방정식이 있습니다. 외관상 그렇게 복잡하지는 않으므로 분해해보겠습니다. 테스트 세트에 N 개의 등급이 있다고 가정합니다. 각 평가에 대해 평가 또는 시스템 예측 y를 호출하고 사용자가 실제로 부여한 평가 x를 평가할 수 있습니다. 두 평가 사이의 차이의 절대 값을 취하여 해당 평가 예측에 대한 오차를 측정합니다. 테스트 세트의 모든 n 등급에 걸쳐 이러한 오류를 합산하고 평균을 얻기 위해 나눈 값으로 나눕니다. 따라서 절대 오차는 정확히, 즉, 예측에서 각 오차의 평균 또는 평균 절대 값입니다. 오류가 나쁘므로 최고 점수가 아닌 최저 MAE 점수를 원합니다..
추천 시스템 : Train/Test and Cross Validation : 훈련, 검증 방법 Train / Test 추천 시스템이 과학만큼 예술적이라는 이유의 대부분은 자신이 얼마나 좋은지 측정하기가 어렵다는 것입니다. 결과에 어떤 미적 품질이 있으며 결과가 좋은 것으로 간주하는지 여부는 말하기가 어렵습니다. 특히 오프라인에서 알고리즘을 개발하는 경우, 추천 시스템의 품질을 측정하기 위해 다양한 방법을 고안한 경우가 많으며, 종종 서로 다른 측정 값이 서로 상충 될 수 있습니다. 먼저 시스템을 오프라인에서 추천 시스템을 테스트하는 방법론에 대해 이야기 해보겠습니다. 머신 러닝을 해본 경험이 있다면, Train/Test 스플릿 개념에 익숙 할 것입니다. 추천 시스템은 사전 사용자 행동을 사용하여 학습 한 다음 이를 사용하여 새로운 사용자가 좋아할만한 항목에 대한 예측을 합니다. 따라서 적어도 다른..
추천 시스템 : Top-N Recommender 아키텍처 Top-N 추천 지금까지 살펴본 모든 추천 시스템은 top-N 추천자 시스템이라고 불리는 것입니다. 즉, 임무는 주어진 사람에게 제시 할 가장 좋은 것들의 유한한 목록을 만드는 것입니다. 다음은 Amazon에서 내 음악 권장 사항을 보여 주며 페이지 당 5 개의 결과 중 20 페이지로 구성되어 있음을 알 수 있습니다. 이것은 N이 100 인 상위 N 추천입니다. 보시다시피, 많은 추천 시스템 리서치는 사용자가 아직 평가하지 않았거나 좋지 않은 것에 대한 사용자의 등급을 예측하는 문제에 초점을 맞추려고 하지만 실제 세계에서 추천 시스템이 하는 것과는 매우 다릅니다. 이 위젯에 표시되는 등급이 다른 사용자의 총 평점이며 시스템이 제공 할 것으로 생각하는 등급이 아닌 이유는 고객이 자신의 등급을 예측할 수 있..
추천시스템 : 암시적 및 명시적 평가를 통한 추천 시스템에 대한 이해 명시적으로 추천 시스템의 작동 원리는 모든 고객 또는 웹 사이트 방문자 또는 서로 데이터를 공유하는 웹 사이트 네트워크까지 이해하는 것이 좋습니다. 추천 시스템은 모든 사용자에 대한 일종의 데이터로 시작합니다. 사용자의 개인 취향과 관심사를 파악하는 데 사용할 수 있습니다. 그러면 자신에 대한 데이터를 원하는 다른 사람의 집단 행동과 병합하여 원하는 것을 추천 할 수 있습니다. 그러나 자신의 고유 관심사에 대한 데이터는 어디에서 왔을까요? 예를 들어 사용자에게 1 ~ 5 개의 등급으로 이와 같은 온라인 강의를 평가하도록 요청하거나 그들이 좋아하는 것 또는 엄지 위로 또는 아래로 엄지 손가락으로 콘텐츠의 등급을 매기도록 요청하는 경우입니다. 명시 적으로 사용자에게 질문하고, 보고있는 것이 마음에 드십니까?..
추천 시스템 : 추천 시스템의 종류 코드와 알고리즘을 배우기 전에, 추천 시스템에 대해 알아보도록 하겠습니다. 매일 시스템을 접하고 생각조차하지 않을 수도 있습니다. 예를 들어, 최근에 가스 구동 발전기를 구입했는데 Amazon은 자동으로 스타터 유체 및 모터 오일과 같은 것을 추천합니다. 이러한 권장 사항이 얼마나 효과적인지 놀랄 수 있습니다. 수십억 달러가 그 결과로 사람들이 필요한 것을 찾는 데 도움을 주었습니다. 아름다운 점은 모든 데이터 중심이라는 것입니다. 추천 시스템은 사용자 간 및 항목 간 관계를 찾을 수 있습니다. 일반적으로 인간의 큐레이션은 전혀 없으며 통계적으로 발전기를 구입하는 사람들은 스타터 유체를 구입하여 사용할 수 있음을 알고 있습니다. 사람들이 원하는 것을 알기 전에 원하는 것을 보여주기 위한 역사적 패턴입니다..
추천 시스템 : 추천 시스템이란? 많은 사람들이 추천 시스템이 무엇인지 모르고 공부를 시작하는 경우가 많습니다. 그리고 어떤 것이 필요할 지에 대해 잘못된 기대를 하기도 합니다. 추천 시스템 혼동 추천 시스템이 정확히 무엇인지 알아보아야 합니다. 그러기 전에 먼저 추천 시스템이 아닌 것에 대해 알아야 할 필요가 있습니다. 단지 임의적인 문제에 대해 임의의 값을 추천하는 시스템이 아닙니다. 그러니 너무 많은 것에 추천 시스템 이름을 붙이면 안됩니다. 추천시스템은 매우 특정한 종류의 머신러닝 시스템입니다. 하지만 기계 학습을 설명하는 임의적인 문제에 대해 값만 추천하는 시스템은 추천시스템이 아니기 때문에 용어를 약간 혼동할 수 있습니다. 예시 예를 들어, 견적을 내는 시스템을 찾고 있다면 집이 얼마나 큰지, 이웃과 모든 것을 기준으로 집값을..