이것은 실제로 머신 러닝 분야에서 비교적 유명한 문제입니다. ~ 2006 년에 Netflix는 추천 시스템에 가장 합리적인 개선을 제공하는 알고리즘에 1 백만 달러를 제공했습니다. 수상한 솔루션의 이론은 소개 머신 러닝에 대한 이 Caltech 교과서 에서 간략하게 설명 합니다.
기본적으로 앙상블 학습 방법 이 사용되었습니다. 특히, 한 유형의 혼합 또는 적층 이 사용되었다. 이것은 사소하지는 않지만 직관적입니다. 서로 다른 통계적 접근 방식을 조화롭게 사용하는 직관을 이해하려면 같은 영화를 좋아하는 사람들이 다른 이유를 고려해야합니다. 즉 Joe는 80 년대 액션 영화를 좋아하기 때문에 Topgun을 좋아할 수 있고 Jane은 Kenny Loggins 사운드 트랙으로 영화를 좋아하기 때문에 Topgun을 좋아합니다. 따라서 두 시청자가 시청하고 영화를 높게 평가했다고해서 반드시 다른 영화를 좋아할 가능성은 없습니다. 예측 알고리즘은 이상적으로는 적어도 일부 용량에서 이러한 차이를 수용 할 수있을 것이다.
이렇게하면 솔루션 사운드가 매우 단순 해지지 만 경쟁 알고리즘의 균형을 잡고 각 사례에 가장 적합한 추측의 우선 순위를 정하는 것은 간단하지 않습니다. Netflix가 그러한 큰 현상금을 제공했다는 사실은 도전의 규모를 다소 분명하게 만들어야합니다.
기계 학습을 시작한 경우 위의 자료를 확인하면 관심 수준과 수학 배경에 따라 도움이 될 수 있습니다. 따라서 회귀는 아마도 양호하게 작동하지만 성능은 훨씬 향상됩니다.