Elo 등급 시스템은 쌍 비교에서 결과의 예상 확률과 관측 확률 사이의 교차 엔트로피 손실 함수의 경사 하강 최소화 알고리즘을 사용합니다. 일반적인 손실 함수를 다음과 같이 작성할 수 있습니다.
E=−∑n,ipiLog(qi)
여기서 합계는 모든 결과 및 모든 상대 됩니다.
는 이벤트 의 관측 된 주파수 이고 는 예상 된 주파수입니다.n p i i q iinpiiqi
두 가지 가능한 결과 (승리 또는 느슨한)와 한 명의 상대의 경우
이자형= - P는 L O g( q) - ( 1 - P ) L O g( 1 − q)
경우 π나는 하여 플레이어의 순위가되고 나는 과 π제이 하여 플레이어의 순위입니다 제이 우리는 기대 확률 구축 할 수
qj=e π j
큐나는= 전자π나는이자형π나는+ 전자π제이
큐제이= 전자π제이이자형π나는+ 전자π제이
그라디언트 하강 업데이트 규칙에 따라 사용
π'나는= π나는− η( q나는− p나는)
π'제이= π제이− η( q제이− p제이)
여기서 큐나는 및 피나는 는 플레이어 j 에 대한 플레이어 i 의 예상 및 관측 된 승률입니다 . 이것이 업데이트 규칙입니다.나는제이two outcomes
추첨이 존재하면 위의 모델을 포함하여 세 번째 결과를 확률로 일반화 할 수 있습니다
qi(w)=eπi
큐( d) = ν이자형π나는+ π제이2이자형π나는+ 전자π제이+ ν이자형π나는+ π제이2
의 QJ(w)=EπJ큐나는( w ) = eπ나는이자형π나는+ 전자π제이+ ν이자형π나는+ π제이2
큐제이( w ) = eπ제이이자형π나는+ 전자π제이+ ν이자형π나는+ π제이2
그리고 Loss 함수를
이자형= − p ( w ) L o g(q( w ) ) - ( 1 - P ( w ) - 피 ( D) ) L 오 g(q( l ) ) - p ( d) L 오 g(q(d) )
여기서 각각의 관측 가능성이있는 , 그리고 및 의 예상 가능성 , 및 . 후자의 경우 업데이트 규칙은q ( w ) , q ( l ) , q ( d )p ( w ) , p ( l ) , p ( d)win
loose
draw
큐( w ) , q( l ) , q(d)win
loose
draw
π'나는= π나는−η( q나는( w ) + q나는(d)2− p나는( w ) − p나는(d)2)
π'제이= π제이−η( q제이( w ) + q제이(d)2−p제이( w ) −p제이(d)2)
여기서 및 는 플레이어 가 플레이어 에 대해 이길 수 있는 예상 확률입니다 . 그리고 여기서 및 는 플레이어 가 플레이어 에 대해 이길 수 있는 관측 된 확률입니다 . 이것이 업데이트 규칙입니다.q j ( d ) i j p i ( w ) p i ( d큐제이( w )큐제이(d)나는제이피나는( w )나 일본피나는( d)나는제이three outcome
문제는 Elo 등급 시스템 two outcomes
이 무승부 상황에서도 업데이트 규칙을 사용하는 이유 는 무엇입니까?