아래는 몇 가지 매우 간단한 모델입니다. 둘 다 적어도 한 가지 방법으로 부족하지만 구축 할 무언가를 제공 할 수 있습니다. 두 번째 모델은 실제로 OP의 시나리오를 다루지 않지만 (아래 설명 참조) 어떤 식 으로든 도움이 될 수 있도록 남겨두고 있습니다.
모델 1 : Bradley–Terry 모델 의 변형
각 팀의 플레이어를 기반으로 한 팀이 다른 팀을 이길 것인지 예측하는 데 주로 관심이 있다고 가정합니다. 최종 점수를 무시하고 각 게임마다 플레이어 가있는 팀 1이 플레이어 ( k , ℓ ) 로 팀 2를 이겼 는지 간단히 기록 할 수 있습니다 . 확실히 이것은 일부 정보를 버리고 있지만 많은 경우 여전히 많은 정보를 제공합니다.(i,j)(k,ℓ)
모델은
logit(P(Team 1 beats Team 2))=αi+αj−αk−αℓ.
즉, 각 플레이어마다 "친 화성"매개 변수가 있으며, 이는 해당 플레이어가 팀 승리 확률을 얼마나 크게 향상시키는 지에 영향을줍니다. 플레이어의 "강도"를 정의하십시오 . 그런 다음이 모델은
P ( 팀 1이 팀 2를 이깁니다 ) = s i s jsi=eαi
P(Team 1 beats Team 2)=sisjsisj+sksℓ.
여기에는 예측 변수와 일치하는 한 응답이 코딩되는 방식이 중요하지 않다는 점에서 매우 훌륭한 대칭이 있습니다. 즉, 우리는 또한
logit(P(Team 2 beats Team 1))=αk+αℓ−αi−αj.
이 지표 복용 (각 플레이어 하나)이다 예측으로 로지스틱 회귀 분석으로 쉽게 적합 할 수 있습니다 값 플레이어 경우 내가 문제의 게임 1 팀에 - 하나는 그녀가 팀 2에 있다면 0 그녀가하지 않은 경우 그 게임에 참여하십시오.+1i−10
이것으로부터 우리는 또한 플레이어들에게 자연스러운 순위를 부여합니다. 클수록 (또는 들 ), 큰 플레이어가 승리의 그녀의 팀의 기회를 향상시킨다. 따라서 추정 계수에 따라 플레이어의 순위를 매길 수 있습니다. 선호도 매개 변수는 공통 오프셋까지만 식별 할 수 있습니다. 따라서 모델을 식별 할 수 있도록 α 1 = 0 을 고정하는 것이 일반적 입니다.αsα1=0
모델 2 : 독립 채점
주의 사항 : OP의 질문을 다시 읽었을 때 아래 모델이 그의 설정에 적합하지 않은 것으로 보입니다. 구체적으로, OP는 한 팀 또는 다른 팀이 일정한 수의 점수를 얻은 후에 끝나는 게임에 관심이 있습니다. 아래의 모델은 시간이 고정 된 게임에 더 적합합니다. OP의 프레임 워크에 더 잘 맞도록 수정이 가능하지만 개발하려면 별도의 답변이 필요합니다.
이제 우리는 점수를 추적하고 싶습니다. 각 팀이 서로 독립적으로 점수를 매기는 것이 합리적 간격과 관계없이 어떤 간격 으로든 점수를 매기는 것이 합리적이라고 가정하십시오. 그런 다음 각 팀의 점수는 포아송 랜덤 변수로 모델링 할 수 있습니다.
따라서 플레이어 로 구성된 일부 팀의 점수 되도록 Poisson GLM을 설정할 수 있습니다ij
log(μ)=γi+γj
이 모델은 팀 간의 실제 경기를 무시하고 순전히 득점에 중점을 둡니다.
σi=eγi(i,j)(k,ℓ)
P(Team 1 beats Team 2 in sudden death)=σiσjσiσj+σkσℓ.
ρiδi(i,j)(k,ℓ)
log(μ1)=ρi+ρj−δk−δℓ
log(μ2)=ρk+ρℓ−δi−δj
스코어링은이 모델에서 여전히 독립적이지만, 이제는 각 팀의 플레이어간에 점수에 영향을주는 상호 작용이 있습니다. 선호도 계수 추정값에 따라 순위를 매길 수도 있습니다.
모델 2 (및 변형)를 사용하면 최종 점수를 예측할 수 있습니다.
확장 : 두 모델을 확장하는 유용한 방법 중 하나는 긍정적 지표가 "홈"팀에 해당하고 부정적인 지표가 "멀리"팀에 해당하는 순서를 통합하는 것입니다. 인터셉트 용어를 모델에 추가하면 "홈 필드 이점"으로 해석 될 수 있습니다. 다른 확장 기능으로는 Model 1과의 연계 가능성이 포함될 수 있습니다 (실제로 Model 2에서는 가능합니다).
참고 : 미국 대학 풋볼에서 Bowl Championship Series 에 사용 된 컴퓨터 설문 조사 ( Peter Wolfe ) 중 적어도 하나 는 (표준) Bradley-Terry 모델을 사용하여 순위를 산출합니다.