팀 스포츠 당 2 인의 개별 플레이어 효과 측정


19

팀 점수 스프레드 시트가 있습니다. 첫 팀이 10 점을 얻습니다. 각 팀에는 2 명의 플레이어가 있습니다. 완벽하게 무작위로 선택되지는 않지만 플레이어는 항상 다른 팀원과 게임을합니다. 개별 점수는 유지되지 않습니다.

그래서 기본적으로 Bill과 Bob이 Andy와 Alice 10-4 Jake를 이기고 Bill은 Joe와 John 10-8을 이겼습니다 ...

사용 가능한 모든 경기 데이터를 기반으로 개별 플레이어에 대한 일부 순위를 제시 할 수 있습니까? 기본적으로 각 플레이어가 포인트 또는 다른 플레이어와 관련하여 각 게임에 얼마나 많은 기여를하는지 아십니까?


1
이 중 어느 것이라도 유용하고 시나리오에 "독립적 인 채점"모델의 간단한 적응의 추가 개발에 관심이 있으시면 저에게 알려주십시오. 간결하게) 별도의 답변으로. 건배.
추기경

답변:


13

아래는 몇 가지 매우 간단한 모델입니다. 둘 다 적어도 한 가지 방법으로 부족하지만 구축 할 무언가를 제공 할 수 있습니다. 두 번째 모델은 실제로 OP의 시나리오를 다루지 않지만 (아래 설명 참조) 어떤 식 으로든 도움이 될 수 있도록 남겨두고 있습니다.

모델 1 : Bradley–Terry 모델 의 변형

각 팀의 플레이어를 기반으로 한 팀이 다른 팀을 이길 것인지 예측하는 데 주로 관심이 있다고 가정합니다. 최종 점수를 무시하고 각 게임마다 플레이어 가있는 팀 1이 플레이어 ( k , ) 로 팀 2를 이겼 는지 간단히 기록 할 수 있습니다 . 확실히 이것은 일부 정보를 버리고 있지만 많은 경우 여전히 많은 정보를 제공합니다.(i,j)(k,)

모델은

logit(P(Team 1 beats Team 2))=αi+αjαkα.

즉, 각 플레이어마다 "친 화성"매개 변수가 있으며, 이는 해당 플레이어가 팀 승리 확률을 얼마나 크게 향상시키는 지에 영향을줍니다. 플레이어의 "강도"를 정의하십시오 . 그런 다음이 모델은 P ( 팀 1이 팀 2를 이깁니다 ) = s i s jsi=eαi

P(Team 1 beats Team 2)=sisjsisj+sks.

여기에는 예측 변수와 일치하는 한 응답이 코딩되는 방식이 중요하지 않다는 점에서 매우 훌륭한 대칭이 있습니다. 즉, 우리는 또한

logit(P(Team 2 beats Team 1))=αk+ααiαj.

이 지표 복용 (각 플레이어 하나)이다 예측으로 로지스틱 회귀 분석으로 쉽게 적합 할 수 있습니다 값 플레이어 경우 내가 문제의 게임 1 팀에 - 하나는 그녀가 팀 2에 있다면 0 그녀가하지 않은 경우 그 게임에 참여하십시오.+1i10

이것으로부터 우리는 또한 플레이어들에게 자연스러운 순위를 부여합니다. 클수록 (또는 ), 큰 플레이어가 승리의 그녀의 팀의 기회를 향상시킨다. 따라서 추정 계수에 따라 플레이어의 순위를 매길 수 있습니다. 선호도 매개 변수는 공통 오프셋까지만 식별 할 수 있습니다. 따라서 모델을 식별 할 수 있도록 α 1 = 0 을 고정하는 것이 일반적 입니다.αsα1=0

모델 2 : 독립 채점

주의 사항 : OP의 질문을 다시 읽었을 때 아래 모델이 그의 설정에 적합하지 않은 것으로 보입니다. 구체적으로, OP는 한 팀 또는 다른 팀이 일정한 수의 점수를 얻은 후에 끝나는 게임에 관심이 있습니다. 아래의 모델은 시간이 고정 된 게임에 더 적합합니다. OP의 프레임 워크에 더 잘 맞도록 수정이 가능하지만 개발하려면 별도의 답변이 필요합니다.

이제 우리는 점수를 추적하고 싶습니다. 각 팀이 서로 독립적으로 점수를 매기는 것이 합리적 간격과 관계없이 어떤 간격 으로든 점수를 매기는 것이 합리적이라고 가정하십시오. 그런 다음 각 팀의 점수는 포아송 랜덤 변수로 모델링 할 수 있습니다.

따라서 플레이어 로 구성된 일부 팀의 점수 되도록 Poisson GLM을 설정할 수 있습니다ij

log(μ)=γi+γj

이 모델은 팀 간의 실제 경기를 무시하고 순전히 득점에 중점을 둡니다.

σi=eγi(i,j)(k,)

P(Team 1 beats Team 2 in sudden death)=σiσjσiσj+σkσ.

ρiδi(i,j)(k,)

log(μ1)=ρi+ρjδkδ
log(μ2)=ρk+ρδiδj

스코어링은이 모델에서 여전히 독립적이지만, 이제는 각 팀의 플레이어간에 점수에 영향을주는 상호 작용이 있습니다. 선호도 계수 추정값에 따라 순위를 매길 수도 있습니다.

모델 2 (및 변형)를 사용하면 최종 점수를 예측할 수 있습니다.

확장 : 두 모델을 확장하는 유용한 방법 중 하나는 긍정적 지표가 "홈"팀에 해당하고 부정적인 지표가 "멀리"팀에 해당하는 순서를 통합하는 것입니다. 인터셉트 용어를 모델에 추가하면 "홈 필드 이점"으로 해석 될 수 있습니다. 다른 확장 기능으로는 Model 1과의 연계 가능성이 포함될 수 있습니다 (실제로 Model 2에서는 가능합니다).

참고 : 미국 대학 풋볼에서 Bowl Championship Series 에 사용 된 컴퓨터 설문 조사 ( Peter Wolfe ) 중 적어도 하나 는 (표준) Bradley-Terry 모델을 사용하여 순위를 산출합니다.


7

XBox Live에서 플레이어 순위를 매기는 데 사용되는 Microsoft의 TrueSkill 알고리즘은 팀 경기를 처리 할 수 ​​있지만 승리 마진은 포함하지 않습니다. 여전히 당신에게 유용 할 수 있습니다.


1

예.

각 플레이어의 승 / 패 기록과 포인트 차이를 볼 수 있습니다. 나는 그것이 간단한 대답이라는 것을 알고 있지만, 그 통계는 여전히 의미가 있습니다.


이것보다 조금 더 복잡한 것을 원합니다. 평균적으로 플레이어가 게임에 X 포인트를 기여하는 것처럼 들립니다. 어떻게 든이 대략적인 근사치를 알아낼 수 있는지 알고 싶었습니다.
Bill Waterson

Jeff Sagarin이 대학 축구 및 기타 스포츠에서 자신의 힘 순위를 어떻게 평가하는지 살펴 보겠습니다. 제 생각에는 그가 공식을 지키고 있지만 MIT에서 석사 과정을 밟는 동안 그렇게했다고 생각합니다. Sagarin은 상대를 얼마나 능가하는지, 상대가 얼마나 좋은지, 일정의 강도 ( '상대가 얼마나 좋은지와 동일 할 수 있습니다')를 고려합니다. Danny Sheridan이라는 동료도 비슷한 시스템을 가지고 있다고 생각합니다. 행운을 빕니다.
Adam

1

(이것을 이전 답변에 대한 의견 으로 추가하고 싶지만 당분간 내 명성은 충분하지 않았습니다)

Martin O'Leary는 TrueSkill 알고리즘을 연결 했으며 좋은 옵션입니다. 당신이 (더 개발보다) 사용에 관심이 있다면, 당신은에 시도 주어야한다 rankade , 우리의 순위 시스템을. TrueSkill과 마찬가지로 각각 2 명 이상의 선수 (2 대 2 축구, 2 대 2 탁구, 농구 3 대 3 및 5 대 5 등)로 2 명의 진영 관리 할 수 ​​있습니다 . 랭커 드는 좀 더 구조화 된 진영을 구축 (1 대 1, 진영 vs 진영, 멀티 플레이어, 멀티 팩션, 협동 게임, 비대칭 진영 등) 할 수 있다는 점과 현저한 차이점이 있습니다.

가장 알려진 순위 시스템 간의 비교 는 다음과 같습니다 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.