확률 모델이 필요합니다.
랭킹 시스템의 기본 개념은 단일 숫자가 플레이어의 능력을 적절히 특성화한다는 것입니다. 이 숫자를 "강도"라고 부를 수 있습니다 ( "순위"는 이미 통계에 특정한 것을 의미하기 때문입니다). 강도 (A)가 강도 (B)를 초과하면 플레이어 A가 플레이어 B를 이길 것으로 예상됩니다. 그러나이 진술은 (a) 정량적이지 않으며 (b) 약한 선수가 때때로 더 강한 선수를 때릴 가능성을 설명하지 않기 때문에 너무 약하다. A가 B를 이길 확률이 강도의 차이에만 의존한다고 가정하면 두 가지 문제를 극복 할 수 있습니다 . 만약 그렇다면, 우리는 힘 의 차이가 승리의 로그 확률과 같 도록 모든 힘을 다시 표현할 수 있습니다 .
구체적으로이 모델은
logit(Pr(A beats B))=λA−λB
여기서 정의에 따르면 는 로그 확률이며 플레이어 A의 강도 등을 위해 를 작성했습니다 .logit(p)=log(p)−log(1−p)λA
이 모델에는 플레이어만큼 많은 매개 변수가 있습니다 (그러나 상대 강도 만 식별 할 수 있기 때문에 자유도가 1 줄 지므로 매개 변수 중 하나를 임의의 값으로 수정합니다). 일종의 일반화 된 선형 모델입니다 (이항 패밀리에서 로짓 링크 사용).
모수는 최대 우도에 의해 추정 될 수 있습니다 . 동일한 이론은 모수 추정치 주변의 신뢰 구간을 세우고 가설을 검정하는 수단을 제공합니다 (예 : 추정치에 따라 가장 강한 선수가 추정 된 가장 약한 선수보다 유의하게 강한 지 여부).
특히 게임 세트의 가능성은 제품입니다
∏all gamesexp(λwinner−λloser)1+exp(λwinner−λloser).
중 하나의 값을 고정한 후 다른 것의 추정치는이 가능성을 최대화하는 값입니다. 따라서 추정값을 변경하면 가능성이 최대 값에서 줄어 듭니다. 너무 많이 줄이면 데이터와 일치하지 않습니다. 이러한 방식으로 모든 모수에 대한 신뢰 구간을 찾을 수 있습니다.이 모수는 추정치의 변화가 로그 우도를 지나치게 감소시키지 않는 한계입니다. 일반적인 가설도 유사하게 테스트 할 수 있습니다. 가설은 강도를 제한합니다 (예 : 모두 같다고 가정).이 제한은 가능성이 커질 수있는 범위를 제한하며,이 제한된 최대 값이 실제 최대 값보다 너무 떨어지면 가설은 다음과 같습니다. 거부되었습니다.λ
이 특별한 문제에는 18 개의 게임과 7 개의 무료 매개 변수가 있습니다. 일반적으로 매개 변수가 너무 많습니다. 유연성이 너무 커서 최대 가능성을 크게 변경하지 않고도 매개 변수를 자유롭게 변경할 수 있습니다. 따라서 ML 기계류를 적용하면 확실한 결과를 얻을 수 있습니다. 즉, 강도 추정값을 신뢰할만한 데이터가 충분하지 않을 수 있습니다.