동적 추천 시스템


14

추천인 시스템은 그에게 관심을 가질만한 항목에 대한 특정 사용자에 대한 다른 사용자의 평가 및 수율 권고 사이의 상관 관계를 측정하는 것입니다.

그러나 시간이 지남에 따라 맛이 바뀌므로 오래된 등급현재 환경 설정을 반영하지 않을 수 있으며 그 반대도 마찬가지입니다. 당신은 지금 당신이 "너무 역 겹지 않은"등으로 평가할 책에 "우수"를 넣었을 수도 있습니다. 또한 관심사 자체도 변합니다.

추천 시스템은 변화하는 환경에서 어떻게 작동해야합니까?

  1. 한 가지 옵션은 "오래된"등급을 차단하는 것입니다. "오래된"등급을 올바르게 정의한다고 가정하면 제대로 작동 할 수 있습니다 (평가가 만료되지 않고 문제가 존재하지 않는 것처럼 보일 수도 있음). 그러나 그것은 최선의 선택은 아닙니다 : 물론 맛은 진화하고, 정상적인 삶의 흐름이며, 과거의 과거 등급을 한 번만 추가 지식을 사용할 수없는 이유는 없습니다.
  2. 또 다른 옵션은이 추가 지식을 어떻게 든 수용하는 것입니다. 따라서 우리는 단지 현재의 이익을위한 "즉시 일치"를 찾을 당신에게 당신이 좋아 할 수있는 것들을 제안하지 수있는 다음 (당신이 좋아 할 수있는 것들에 반대 지금을 ).

이것을 충분히 잘 설명하고 있는지 잘 모르겠습니다. 기본적으로 저는 두 번째 접근 방식에 찬성하고 취향 궤적 의 상관 관계를 측정하고 권장 사항을 제공하는 권장 시스템에 대해 이야기하고 있습니다. "맛 테이트 스냅 샷"뿐만 아니라 "맛 테이스트 궤적"도 여러분과 비슷합니다.

이제 질문 : "옵션 2"와 비슷한 것이 이미 존재하는지 궁금하다면 어떻게 작동하는지 궁금합니다. 그리고 그것이 존재하지 않는다면, 그것이 어떻게 작동하는지 논의 할 수 있습니다! :)

답변:


8

이 문제에 대해 자세히 설명하는 Yehuda Koren (Netflix Contest!)의 시간 역학이용한 공동 필터링 필터링을 추천합니다 .

나는 첫 번째 옵션 ( "잘라 내기")이 갈 길이 아니라는 저자에 동의한다. 오래된 환경 설정은 그런 식으로 무시되지만 a) 일부 환경 설정은 절대 변경되지 않으므로 상록수를 식별하기 위해 데이터를 죽이고 b) 미래의 환경 설정을 이해하려면 과거의 일부 환경 설정이 필요합니다 ( 예를 들어 시즌 1 구매-> 시즌 2 구매 가능성이 있음).

그러나 Koren은 이러한 궤적을 명시 적으로 식별하려고 시도하지 않습니다 (즉, 사용자의 향후 변경 동작을 예측할 수 있도록). 이는 매우 어려운 작업이기 때문입니다. 궤적을 따라 선호하는 "스테이션"은 시간에 구애받지 않고 사용자의 개인 개발에 영향을 미치거나 다른 궤적에 의해 중단되거나 교차되거나 단순히 다른 방식으로 표현 될 수 있다는 점을 명심하여이를 상상할 수 있습니다. 예를 들어 하드 액션 영화에서 액션 영화로 이동하는 경우, 명확한 "엔트리 소프트 액션 영화"또는 이와 유사한 것은 없습니다. 사용자는 언제 어디서나 (시간 및 항목 공간에서)이 영역을 입력 할 수 있습니다. 이 문제는 데이터의 복잡성과 결합하여 여기서 실현 가능한 모델을 만드는 것이 거의 불가능합니다.

대신 Koren은 등급 예측의 효과를 높이기 위해 과거 데이터를 장기 패턴 신호와 일일 노이즈로 분리하려고합니다. 그는이 접근법을 SVD와 간단한 협업 neigborbood 모델 모두에 적용합니다. 불행히도, 나는 아직 수학을 끝내지 않았으므로 이에 대한 자세한 내용을 제공 할 수 없습니다.

궤적의 명시 적 모델링에 대한 추가 참고 사항

시퀀스 마이닝 영역은 수행 할 방법을 제공하지만 중요한 포인트는 항목에 대한 적절한 추상 표현을 찾는 것입니다 (예 : 항목 자체를 사용하면 좁아서 작동하지 않기 때문에). 그러나이 접근 방식은 일부 사용자의 행동에 대한 통찰력을 제공 할 수 있지만 (데이터 마이닝!) 모든 고객 (즉, 대량)에 대한 응용 프로그램과 관련하여 관련이 없을 수 있으므로 Koren이 제안한 암시 적 모델링이 결국 더 나은.


Yehuda 논문은 실제로 "맛 궤적"에 대해서는 이야기하지 않지만, 내가 말한 것에 매우 가깝습니다. 아마 당신은 정확하고 "맛 변경 속도"는 누구에게나 고정되어 있지 않습니다 .. 링크 주셔서 감사합니다!
andreister

네, 이것이 제가 생각한 첫 번째 것입니다.
Stumpy Joe Pete

2

나는 작동하는 시스템을 알지 못하지만 Amazon, NetFlix 또는 누군가가 그러한 시스템을 가지고 있다면 놀라지 않을 것입니다. Google 검색 엔진도 비슷한 유형의 시스템을 가지고있을 수 있습니다.

지난 학기 응 박사의 과정을 밟는 동안 나는 이것에 대해 생각했다. 내가 처음에 최적이라고 생각한 방법은 나이를 기준으로 가중치를 추가하는 것입니다. 최신 데이터 일수록 가중치가 더 커집니다. 이 방법은 구현이 비교적 간단하고 계산 비용이 저렴합니다.

그러나이 접근법을보다 신중하게 생각한 후에는 많은 응용 프로그램에 심각한 결함이 있다고 생각합니다. 개인적으로, 나는 종종 장르를 따라 가거나 한동안 보여주고, 피곤하고, 다른 것으로 넘어가지만 나중에 원래 장르로 돌아갑니다. 이 소진, 재발견주기는 사회에서도 나타납니다.

따라서 약간 더 복잡한 시스템을 향해 기울고 있습니다. 데이터는 두 세트로 나뉘어 야합니다. 현재 데이터 (임계 값은 응용 프로그램과 개인의 상호 작용 길이에 따라 달라져야 함)-더 무겁게 가중치가 부여되고 "역사적"데이터는 시간이 지남에 따라 값이 느리게 하락하여 등급이 낮습니다. 둘째, 큰 관심이나 참여가 갑자기 사라지는 "끄기"를 감지하는 요소가 포함됩니다. 유사하게 분류 된 "현재"데이터는 마치 과거 데이터 인 것처럼 재 분류됩니다.

이 접근법 중 어느 것도 엄격하거나 검증되지는 않았지만 가설에 대한 몇 가지 시도를 구성 할 가치가 있다고 생각합니다.


오래된 데이터에 대한 가중치가 낮다는 생각은 실제로 "옵션 1"과 유사합니다. 대신, 나는 변화하는 맛 의 전체 궤적 이 중요 하다고 말합니다. 즉, 어제 장르 A를 좋아하고 오늘날 장르 B를 좋아한다면, 시스템은 동일한 "AB- ??"를 가진 다른 사람들을 볼 것입니다. 미각은 움직이며 내일 C 장르를 원할 것을 제안합니다.
andreister

1

보시다시피, 수정 된 버전의 협업 필터링이 작동 할 수 있습니다. 그러나 각 순위에 타임 스탬프를 유지하고 더 오래된 순위의 가중치를 계산하는 동안 위약금을 부과해야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.