FIDE가 여전히 Elo를 사용하는 이유는 무엇입니까?


11

Glicko 등급 시스템의 작동 방식에 깊은 인상을 받았습니다 . 특히:

  • 최근에 더 많은 게임을하면 등급이 안정화됩니다
  • 최근에 플레이 한 게임 수가 적을수록 벨트 아래에서 최근에 여러 게임이 나올 때까지 등급이 변동됩니다

USCF는 몇 년 전과 비슷하게 시스템을 수정했으며 (주어진 경기에 대한 등급 변경을 증폭하거나 완화시키는 슬라이딩 스케일이 있음) Glickman (Glicko의 발명가)이 USCF의 등급위원회에 올라 섰습니다. 나는 그들이 자신의 시스템과 같이 훨씬 더 유연한 시스템을 채택 할 것이라고 생각합니다.

FIDE가보다 정확한 등급 시스템을 채택하지 않은 이유가 있습니까 (변경에 대한 저항력이 있거나 아직 변경되지 않은 이유가 있습니까)?

답변:


9

글리코가 더 정확한 것으로 입증되지 않았습니다. Glicko는 다른 방식으로 문제를 다른 방식으로 해결합니다. 이 모든 시스템은 인간의 마음을 4 자리 숫자로 추상화합니다.

등급에는 많은 정치가 있습니다. 감동적인 주제입니다. FIDE가 그것을 채택한다면, 그들은 새로운 최고 100리스트를 만들 것이고, 많은 GM들이 화를 낼 것입니다.

ELO 시스템은 이해하기 매우 쉽습니다. 투명성이 중요합니다. 보다 복잡한 시스템에는 즉각적인 단점이 있습니다.


6
+1, 첫 번째 단락에 동의하지 않아도 나머지는 충분합니다. 1) 글리코는 평균적으로 더 정확한 것으로 입증되었습니다 (주어진 경기에서 누가 이길 것인지 예측할 수있는 빈도로 측정). 2) 인간의 마음을 숫자로 추상화하는 것에 관해서는, 실제로는 그렇지 않습니다. 스킬 레벨을 비교할 때 확률 (승 / 드로우 / 손실)을 계산할 수있는 스킬의 척도입니다. 그것은 모두 수학과 통계에 의해 뒷받침됩니다. Glicko-2에는 일관성이없는 플레이어 (등급이 더 변동될 수 있음)를위한 새로운 변동성 요인이 있습니다.
Eve Freeman

1
흥미 롭군 그러나 '평균 이상'이 반드시 '더 나은'것은 아니라고 확인합니다. 더 정확한 시간이 실제 피해를 입히는 경우 어떻게됩니까? 그러나 나는 그것을 읽을 것이다.
Tony Ennis



7

내가 이해하는 한, Glicko 평가 시스템은 평가 점수에 신뢰도 점수를 추가하여 평가 점수 조정 계산과 관련하여 더 높은 공정성을 제공 할 수 있습니다. 분명히 이것은 등급이 매겨진 게임과 결과적인 플레이 강도 사이에 상관 관계가 있다는 잘못된 가정으로 이어질 수 있습니다 (플레이를하지 않으면 신뢰도 점수가 감소하여 결국 등급 번호를 어떻게 평가하지 않기 때문입니다). 나는 시스템의 미묘함에 대해 전문가가 아니라는 것을 인정해야하지만 신뢰성 점수와 관련된 많은 문제를 봅니다. 그냥 세 가지를 선택하십시오.

  • 희귀 등급 게임 만하는 플레이어는 더 이상 초대를받지 못할 수 있습니다. 매력적인 플레이어를 초대하는 토너먼트 디렉터라고 상상해보십시오. 이제 10 개의 플레이어 중에서 선택해야합니다.이 플레이어는 모두 동일한 등급 번호를 갖지만 신뢰도는 다릅니다. 아마도 가장 신뢰할 수있는 번호를 먼저 선택했을 것입니다. 시간이 지남에 따라 많은 등급의 게임을 가진 플레이어와 적은 게임을하는 플레이어 사이의 신뢰성 차이가 커질 수 있습니다.
  • 등급 번호 조작이 쉬워 질 수 있습니다. 일부 사람들은 리그 토너먼트를 통해 등급이나 IM / GM 기준을 얻었 기 때문에 ELO 시스템조차 치트 안전하지 않습니다. 신뢰성 점수가 높으면 신뢰성 점수가없는 플레이어를 매우 저렴하게 도울 수 있습니다. 우수한 플레이어는 자신을 잃지 않고 등급을 부여합니다. 돈이 들어 오자마자 치트 안전은 중요한 문제입니다. 나는 Glicko 등급 시스템이 조작하기 쉽다는 느낌을 받았습니다.
  • 연주 강도에 대한 의사 소통과 이해는 대중에게 더 어려워 질 수 있습니다. 순위 목록을 전달하면 문제가 발생합니다. 2000-50 등급의 플레이어는 1900에서 2100 사이의 "실제 재생 강도"를 갖습니다. 다른 플레이어는 1950-2000을 얻었으며 1750-2150 범위의 숫자로 해석됩니다. 따라서 1950-2000의 플레이어 실제로는 더 나은 선수 일지 모르지만 아마도 적은 게임을 하였거나 덜 신뢰할 수있는 상대와 비교했을 때만 다른 선수보다 순위가 낮을 것입니다. 더 공정성을 보장하지 않으면 서 사람들에게 순위 시스템을 설명하기 어렵게 만듭니다. 재생을 멈추는 GM은 "잠재력"을 얻고 그의 세계적 가능성에 대해 자랑 할 수 있습니다.

요약하자면 : 전체 패키지에는 개선 사항이 포함되어 있지 않기 때문에 할인보다 더 많은 것을 얻을 수 있습니다. 그리고 순위 목록의 상단을 볼 때 많은 금전적 문제가 있기 때문에 기존 시스템을 변경하는 장점을 보지 못합니다.


대부분의 순위 목록에는 신뢰도 점수 (RD)를 사용하여 플레이어 순위를 매기는 대신 컷오프가 있습니다. 따라서 2000 (50)은 항상 1950 (100)보다 높은 순위에 있습니다. 현재 등급에 따르면 신뢰성에 관계없이 등급이 더 높습니다. 1950 (100) 플레이어가 2000 (50)에 이길 경우, 1950 (50)보다 등급이 더 크게 증가합니다. Glicko로 시스템을 속이는 방법에 대해 자세히 설명 할 수 있습니까? RD가 높으면 등급을 샌드백하는 것에 대해 이야기하고 있습니까?
Eve Freeman

@ West Freeman : 나는 이것이 등급 시스템의 상대적인 치트 경향을 증명하기에 완벽한 장소라고 생각하지 않으며, 나는 그 등급을 많이 풀지 않기 때문에 시스템을 조작하는 것이 더 저렴 해지기 때문에 추측을하고 있습니다. 등급이없는 플레이어에 대해 의도적으로 패배했을 때 내 대답의 더 중요한 점은 작업 시스템을 폐기하기 전에 계산 공정성뿐만 아니라 부정 행위, 의사 소통 가능성 등 시스템을 확인해야한다는 것입니다.
Ray

그러나 인위적으로 누군가의 등급을 올리는 것이 어떻게 도움이됩니까? 일반적으로 시스템을 게임하려는 사람들은 등급을 낮추려고 노력하여 더 낮은 섹션에서 플레이하고 첫 상을 수상 할 수 있습니다. 오랜 시간 동안 게임을하지 않으면 이겼을 게임 몇 개를 잃으면 Glicko를 사용하면 더 쉬울 수 있습니다. 그러나 등급 층과 결합하여 RD가 백업에 시간이 걸리기 때문에 가끔씩 만 수행 할 수 있습니다.
Eve Freeman

1
타이틀을 얻거나, 초대장을 받거나, 클럽에서 게임을하거나 트레이너로 활동하기 위해 클럽의 지불을 받으려면 높은 평가가 필요할 수 있습니다. 나는 당신이 FIDE의 행동에 의문을 제기했기 때문에 여기와 실제 돈이있는 전문 체스에 대해 이야기하고 있습니다.
Ray
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.