부분 순위 목록을 전역 순위로 변환

다음 문제와 같은 일을하고 있습니다. 많은 사용자와 N 권의 책이 있습니다. 각 사용자는 책 1> 책 40> 책 25와 같이 자신이 읽은 모든 책 (N 책의 하위 집합 일 수 있음)의 순서 순위를 만듭니다.

이제이 개별 사용자 순위를 모든 도서의 단일 주문 순위로 바꾸고 싶습니다.

시도해 볼만한 좋은 방법이나 표준적인 방법이 있습니까? 지금까지 Bradley-Terry 모델을 쌍별 비교에 적용하려고 생각하고 있지만 다른 것이 있는지 궁금합니다.

— 래그 틴
소스

사용자가 어떤 이유로 비슷한 책을 읽지 않으면 희소성에 많은 문제가 발생할 것이라고 생각합니다. 그러나 n 명이 주어졌고 대부분의 사람들이 비교적 적은 양의 책을 읽었다면, 대다수의 쌍은 한 사람 만 비교할 것입니다. (중간 값은 1 인당 6 명이었다. Pew

— Peter Flom-Monica Monica 복원

(+1) raegtin, 당신은 좋은 재미있는 질문을합니다. 나는 BT 모델을 좋아하지만 여기서 약간 힘이 든 것 같습니다. 협업 필터링 문헌에 익숙하십니까? 같은 문제는 아니지만 일부 개념과 기술을 빌릴 수 있습니다. 여기서 다루지 않은 질문은 왜 책이 명확하고 명확하게 순위가 매겨 질 수 있다고 믿어야 하는가입니다. (어떻게 예를 들어, 두 사용자,이 책의 사건을 처리 할 것인가?)

— 추기경

@Peter Flom : 맞습니다. 대부분의 쌍에는 비교가 없습니다. 그러나 A> B 및 B> C를 알고 있다면 A와 C가 직접 비교되지 않더라도 A> C를 유추 할 수

— 있기를 바랍니다

@cardinal : 그렇습니다 .BT 모델은 여기에서 강요되는 것처럼 보이지만 지금 생각할 수있는 유일한 것입니다. 공동 필터링 문헌에 익숙하지만 유사성이 아닌 순위를 원하므로 여기에 어떻게 적용되는지 잘 모르겠습니다. 단일 세계 순위가 반드시 의미가있는 것은 아니며 (예 : 아동 도서와 성인 도서, 소설과 논픽션을 비교하는 것이 합리적입니까) 실제로는 여전히 유용합니다. "최고의"책 목록은 항상 팝업 :)

— raegtin

또한, 나는 밀접한 주문 (예를 들어, 책 순위 # 1이 책 # 2보다 실제로 더 나은지)에 대해 크게 신경 쓰지 않고 오히려 전체적으로 주문합니다 (예를 들어, 주문에서 책의 상위 10 %를 원합니다) 하단 10 % 또는 중간 10 %보다 낫습니다).

— raegtin

답변:

당신이 (더 개발보다) 사용에 관심이 있다면, 당신은에 시도 주어야한다 rankade , 우리의 순위 시스템을.

Rankade는 무료이며 사용하기 쉬우 며 2 개 이상의 진영 (예 : 시나리오의 서적) 과 일치 하는 항목을 관리 할 수 있기 때문에 Bradley-Terry 모델 및 Elo 순위 시스템 (여기서는 비교 ) 과 다릅니다 . 사용자의 정렬 된 순위를 지정하면 ( 두 개 이상의 책 사이의 일치 , 자세한 최종 순위 및 관계 포함) 원하는 모든 책 의 단일 순위를 얻을 수 있습니다 . 중독에서 랭커 드는 책 순위의 시간 진화와 책 매치업 등의 통계를 확인할 수있는 기회를 제공합니다.

— 토 마소 네리
소스

최소한 일반적으로 접근 방식으로 알고리즘을 설명해야합니다. 그리고 전체 설명이 나와있는 종이에 연결하십시오. 그렇지 않으면 답변이 단순한 광고로 간주 될 수 있습니다.

— ttnphns

ree 와 가장 알려진 순위 시스템을 간단히 비교할 수있는 링크를 추가했습니다 . 첫 번째 진술에 따르면 (개발보다 더 많은) 사용에 관심이 있다면 문제에 대한 해결책으로 제안됩니다 (순위는 GUI를 특징으로하지만 Bradley-Terry 및 Plackett-Luce는 구현을 사용해야합니다). 요청 된 솔루션에 도달하기위한 경로입니다.

— Tomaso Neri

Plackett-Luce 순위 모델은이 문제를 다루며 가능성이 가장 큰 가능성 함수에 대해 보조 목적 함수를 사용한다는 점에서 기대 최대화와 유사한 주요 화 최대화 루틴을 사용하여 가능성을 최대화하는 가능성 기반 기술입니다. 우도 함수의 반복적 인 단조로운 최대화를 보장하도록 최적화되었습니다. (David Hunter의 Plackett-Luce 순위 모델에 대한 MM 알고리즘 참조). 그는 코드도 제공합니다.

순위 관점에서 볼 때 이들은 게시물에서 언급 한 Bradley-Terry 모델의 확장입니다. Bradley-Terry 모델은 표본 쌍별 순위에서 전체 순위를 추정합니다. Plackett-Luce 모델은 이것을 길이 2의 순위로 확장합니다 . 또한 각 샘플이 다른 길이의 순위가되도록합니다. $>=$

이것은 데이터 셋에 완벽하게 맞습니다 :

제 1 권> 제 40 권> 제 25 권

제 40 권> 제 30 권

제 25 권> 제 17 권> 제 11 권> 제 3 권 등

— 영구차
소스