협업 필터링과 컨텐츠 기능을 통합하는 추천 시스템을 작성하는 방법은 무엇입니까?


10

Recommender System을 만들고 있는데 "유사한"사용자의 등급과 항목의 기능을 모두 통합하려고합니다. 출력은 예상 등급 [0-1]입니다. 신경망을 고려하고 있습니다 (시작).

따라서 입력은 항목의 기능과 각 사용자의 등급의 조합입니다. 항목 A와 사용자 1의 경우 시스템은 결합 된 데이터 A1에 대해 학습 할 수 있습니다. 이것은 하나의 훈련 예입니다.

사용자 1이 영화 B를 평가 한 경우 어떻게 되나요? 그렇다면 데이터 B1도 훈련의 예일까요? 이런 방식으로 사용자 1의 기능으로 교육을 반복하는 데 문제가 있습니까?

문제에 접근하는 더 좋은 방법에 대한 제안이 있습니까?

답변:


11

문제를 완전히 이해하기 전에 왜 신경망을 고려하고 있습니까?

협업 필터링을위한 표준 매트릭스 인수 분해 방법은 컨텐츠 기능을 쉽게 활용할 수 있습니다. 베이지안 설정에서이 작업을 수행하는 방법에 대한 예 는 성냥갑 종이를 참조하십시오 .


6

컨텐츠 인수 (여기서는 주제 모델)와 매트릭스 인수 분해를 통합하는 방법에 대한 세 가지 논문 :

  • Deepak Agarwal과 Bee-Chung Chen. fLDA : 잠재 디리 클릿 할당을 통한 매트릭스 인수 분해. 웹 검색 및 데이터 마이닝에 관한 제 3 회 ACM 국제 컨퍼런스 (WSDM '10) ACM, 뉴욕, 뉴욕, 미국, 91-100.
  • Hanhuai Shan과 Arindam Banerjee. 2010. 협업 필터링을위한 일반화 된 확률 행렬 인수 분해. 2010 년 IEEE 국제 데이터 마이닝 회의 (ICDM '10) 진행. IEEE 컴퓨터 학회, 워싱턴 DC, 미국, 1025-1030.
  • Chong Wang과 David M. Blei. 과학 기사 추천을위한 협업 주제 모델링. 지식 발견 및 데이터 마이닝에 관한 제 17 회 ACM SIGKDD 국제 컨퍼런스 (KDD '11)의 진행. ACM, 뉴욕, 뉴욕, 미국, 448-456.

나는 또한이 이슈에 대해 조금 논의하는 내 블로그 항목을 홍보 할 것이다 : 주제 모델은 Lantent Factor 모델을 만족시킨다


3

신경망 접근법이 필요하지 않으며 협업 필터링은 자체 알고리즘입니다. 특히 문제의 경우 다음에 대한 cf 및 recomender 시스템에 대한 좋은 설명이 있습니다.

ml-class.org

(XVI : Recommender Systems를 찾으십시오). 우아하고 단순하며 올바르게 수행하면 (즉, 벡터화 된 양식, 빠른 최소화 기 및 준비된 그라디언트 사용) 매우 빠릅니다.


나는 그 접근법을 사용했지만 항목의 기능을 사용하지는 않습니다. 기능도 포함하고 싶습니다.
B 세븐
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.