SW/추천시스템

추천시스템 : 암시적 및 명시적 평가를 통한 추천 시스템에 대한 이해

얇은생각 2020. 7. 22. 07:30
반응형

명시적으로

 

추천시스템 : 암시적 및 명시적 평가를 통한 추천 시스템에 대한 이해

 

추천 시스템의 작동 원리는 모든 고객 또는 웹 사이트 방문자 또는 서로 데이터를 공유하는 웹 사이트 네트워크까지 이해하는 것이 좋습니다. 추천 시스템은 모든 사용자에 대한 일종의 데이터로 시작합니다. 사용자의 개인 취향과 관심사를 파악하는 데 사용할 수 있습니다.

그러면 자신에 대한 데이터를 원하는 다른 사람의 집단 행동과 병합하여 원하는 것을 추천 할 수 있습니다. 그러나 자신의 고유 관심사에 대한 데이터는 어디에서 왔을까요? 예를 들어 사용자에게 1 ~ 5 개의 등급으로 이와 같은 온라인 강의를 평가하도록 요청하거나 그들이 좋아하는 것 또는 엄지 위로 또는 아래로 엄지 손가락으로 콘텐츠의 등급을 매기도록 요청하는 경우입니다.

명시 적으로 사용자에게 질문하고, 보고있는 것이 마음에 드십니까? 그리고 그 데이터를 사용하여 해당 사용자의 관심사에 대한 프로필을 작성합니다. 명시적인 평가나 피드백의 문제는 추가 작업이 필요하다는 것입니다. 모든 사람이 자신이 보는 모든 것에 대해 등급을 매기도록 귀찮게 할 수는 없으므로 이 데이터는 매우 희소 한 경향이 있습니다.

데이터가 너무 희소한 경우 낮은 품질의 추천 시스템으로 이어질 수 있습니다. 그래서 4 스타 리뷰의 의미는 두 사람 사이에서 다를 수 있습니다. 어떤 사람들은 다른 사람들보다 더 비판적 일 수 있습니다. 사람들이 다른 나라 간의 코스를 평가하는 방법에 차이가 있을 수 있습니다.

 

 

 

암묵적으로

 

추천시스템 : 암시적 및 명시적 평가를 통한 추천 시스템에 대한 이해

 

암묵적인 행동을 통해 개인의 취향을 이해하는 또 다른 방법입니다. 이것은 하는 일을 보고 그것을 관심의 표시로 해석하는 것입니다. 웹 페이지의 링크를 클릭하면 해당 링크 및 해당 콘텐츠에 대한 암시적 긍정적 평가가 고려 될 수 있습니다.

또는 광고를 클릭하면 광고 네트워크와 유사한 다른 광고를 찾을 수 있습니다. 클릭 데이터는 데이터 희소성에 문제가 없지만 클릭이 항상 관심의 대상이 되는 것은 아니기 때문에 훌륭합니다. 일부 이미지가 관련되어 있기 때문에 실수로 클릭하면 무언가를 클릭 할 수 있습니다. 클릭 데이터만 사용하는 추천 시스템을 구축하는 것이 어려운 이유입니다.

클릭 데이터도 매우 취약합니다. 사기로 인해 인터넷을 악용하는 사악한 사람들에 의해 데이터를 오염시킬 수 있는 많은 봇이 있습니다. 구매 한 것은 실제로 지갑을 열고 열심히 벌어 들인 돈을 소비하기 때문에 관심의 표시가 됩니다. 선물이 아닌 한, 그 자체의 문제입니다.

사기에 매우 강하기 때문에 구매를 암시적 긍정적 평가로 사용하는 것도 좋습니다. 구매 행동을 기반으로 추천 시스템을 조작하면 결과에 영향을 줄 수 있는 많은 물건을 구매해야하기 때문에 엄청나게 비싸다는 것을 알게 될 것입니다.

Amazon의 추천이 너무 좋은 이유 중 하나는 구매 데이터가 너무 많아서 다른 사람의 관심사에 대한 훌륭한 신호를 의미합니다. 작업하는 데이터가 시작하기에 너무 좋기 때문에 훌륭한 추천 알고리즘이 필요하지 않습니다. 예를 들어, YouTube는 비디오 시청 시간을 몇 분 동안 얼마나 좋아했는지 표시 할 수 있습니다. 

소비 데이터는 돈과 같은 구매 데이터를 소비 할 필요는 없지만 시간을 소비해야하기 때문에 시간이 많이 소요됩니다. 클릭 데이터와 비교했을 때 매우 신뢰할 수있는 관심있는 지표이므로 YouTube에서 몇 분 동안 추천 알고리즘을 많이 시청한 이유와 YouTube 사용자가 실제로 전체 동영상을 끝까지 시청할 수 있도록 열심히 노력하는 이유가 있습니다.

추천 데이터를 설계 할 때는 추천 할 데이터 소스에 대해 생각하는 것이 중요합니다. 최상의 추천 시스템조차도 작업하기에 좋은 데이터가 없고 많은 양의 데이터가 없으면 좋은 결과를 얻을 수 없기 때문에 사용자의 관심과 시작부터 시작합니다.

반응형