답변:
도움이 될만한 자료는 다음과 같습니다.
Recommenderlab - 개발 및 추천 알고리즘을 테스트하기위한 프레임 워크와 오픈 소스 소프트웨어 : http://lyle.smu.edu/IDA/recommenderlab를 . 해당 R
패키지 recommenderlab
: http://cran.r-project.org/package=recommenderlab .
다음 블로그 게시물 은 협업 필터링을 기반으로 영화 추천 응용 프로그램 recommenderlab
을 구축하기위한 패키지 (IMHO가 모든 오픈 소스 추천 엔진에 대해 일반화 될 수 있음)를 사용하는 방법을 보여줍니다 . http://scn.sap.com/community/developer-center/hana / blog / 2013 / 11 / 06 / movie-recommendation-by-leveraging-r .
추천인 시스템에 관한 연구 - Recommenderlab의 수석 개발자 인 마이클 Hahsler에 의해 유지되는 주제에 자원을 가진 멋진 웹 페이지 : http://michael.hahsler.net/research/recommender .
박격포 추천 엔진 에 대한 오픈 소스 사용자 정의 추천 엔진 - Hadoop
및 Pig
작성, Python
그리고 Java
: https://github.com/mortardata/mortar-recsys . 이 프로젝트의 개발을 후원하는 회사 인 Mortar Data 는 (공공 프로젝트의 개발 및 호스팅은 무료입니다) http : //www.mortardata를 포함한 프로젝트를 포함하여 데이터 과학 소프트웨어 프로젝트의 개발 및 호스팅을위한 일반적인 상용 클라우드 플랫폼 을 제공합니다 . COM . Mortar Data는 포괄적 인 자습서 뿐만 아니라 공개 Q & A 포럼 ( https://answers.mortardata.com ) 형태의 도움말을 제공합니다.Mortar Recommendation Engine
개방형 기술을 사용하여 추천 엔진을 구축하는 방법 ( http://help.mortardata.com/data_apps/recommendation_engine )
"추천인 시스템 소개" : 내용과 설명이 주제에 대한 추가 리소스를 제공하는 관련 코 세라 코스 (MOOC) - https://www.coursera.org/course/recsys .
PredictionIO- 오픈 소스 머신 러닝 서버 소프트웨어로, 추천 시스템을 포함한 데이터 과학 애플리케이션을 구축 할 수 있습니다 : http://prediction.io (소스 코드는 GitHub에서 사용 가능합니다 : https://github.com/PredictionIO ). PredictionIO
내장 추천 엔진 ( http://docs.prediction.io/current/engines/itemrec/index.html )을 포함하며 RESTful
API 및 SDK / 플러그인을 통해 광범위한 프로그래밍 언어 및 프레임 워크를 지원합니다. PredictionIO는 유지 Amazon Machine Image
에 AWS 마켓 플레이스를 AWS 인프라에 애플리케이션을 배포 : https://aws.amazon.com/marketplace/pp/B00ECGJYGE.
주제와 관련된 추가 오픈 소스 소프트웨어 프로젝트 ( 기계 학습 오픈 소스 소프트웨어의 MLOSS
웹 사이트를 통해 발견됨 : http://www.mloss.org ) :
다음 관련 R
블로그 게시물 도 흥미 롭습니다.
협업 필터링 대신 매트릭스 인수 분해 방식을 사용합니다. 여기서 사용자와 영화는 내적 제품이 등급을 산출하는 잠재 특징 벡터로 표현됩니다. 일반적으로 지형지 물이 나타내는 내용에 관계없이 순위 (지형지 물 수)를 선택하면 알고리즘이 나머지를 수행합니다. PCA와 마찬가지로 결과를 즉시 해석 할 수는 없지만 좋은 결과를 얻을 수 있습니다. 당신이하고 싶은 것은 언급 한 추가 기능을 포함하도록 영화 행렬을 확장하고 알고리즘이 정규화를 사용하여 두 행렬을 추정함에 따라 고정되어 있는지 확인하는 것입니다. 사용자 행렬의 해당 항목은 무작위로 초기화 된 다음 행렬 분해 알고리즘에 의해 추정됩니다. 다재다능하고 성능이 좋은 방법이지만 머신 러닝에 대한 이해가 필요합니다.
나는 멋진 ipython 노트북을 얼마 동안 보았지만 지금은 그것을 찾을 수 없으므로 , 좋지는 않지만 여전히 수학 중 일부를 명확하게하는 다른 것을 참조 할 것 입니다.