추천 시스템은 특정 사용자에 대한 권장 사항과 해당 사용자가 권장 사항을 수락하는지 여부를 기록합니다. 마치
user_id item_id result
1 4 1
1 7 -1
5 19 1
5 80 1
여기서 1은 사용자가 권장 사항을 수락했음을 나타내고 -1은 사용자가 권장 사항에 응답하지 않았 음을 나타냅니다.
질문 : 위에서 설명한 로그 종류에 따라 여러 사용자에게 추천을하고 MAP @ 3 점수를 최대화하려면 암시 적 데이터 (1 또는 -1)를 어떻게 처리해야합니까?
내 생각은 1과 -1을 등급으로 취급하고 인수 분해 기계 유형 알고리즘을 사용하여 등급을 예측하는 것입니다. 그러나 암시 적 데이터의 비대칭 성을 고려할 때 이것은 옳지 않은 것처럼 보입니다 (-1은 사용자가 권장 사항을 좋아하지 않는다는 것을 의미하지는 않습니다).
편집 1 행렬 인수 분해 방식의 맥락에서 생각해 보자. -1과 1을 등급으로 취급하면 몇 가지 문제가 있습니다. 예를 들어, 사용자 1은 잠재 인자 공간에서 하나의 인자 (예를 들어, 화려한 배경 음악을 갖는)에서 높은 점수를 갖는 영화 A를 좋아한다. 이 시스템은 "유쾌한 배경 음악"에서 높은 점수를받은 영화 B를 추천하지만 어떤 이유로 사용자 1은 너무 바빠서 추천을 보지 못하며 -1 등급 영화 B를 가지고 있습니다. 그런 다음 시스템은 사용자 1에게 영광스러운 BGM이있는 영화를 추천하는 반면 사용자 1은 여전히 영광스러운 BGM이있는 영화를 좋아합니다. 이 상황을 피해야한다고 생각합니다.