캐글 대회는 개최 테스트 세트를 기반으로 최종 순위를 결정합니다.
보류 된 테스트 세트는 샘플입니다. 모델링되는 모집단을 대표하지 않을 수도 있습니다. 각 제출은 가설과 같으므로 경쟁에서이긴 알고리즘은 우연히 테스트 세트를 다른 것보다 더 잘 일치시킬 수 있습니다. 다시 말해, 다른 테스트 세트가 선택되고 경쟁이 반복되는 경우 순위는 동일하게 유지됩니까?
후원 회사의 경우 이는 중요하지 않습니다 (아마도 상위 20 개 제출물이 기준을 개선 할 것임). 아이러니하게도, 그들은 다른 상위 5 개보다 나쁜 1 순위 모델을 사용하게 될 수 있습니다 . 그러나 경쟁 참가자에게는 Kaggle이 궁극적으로 우연의 게임 인 것처럼 보입니다. 적절한 솔루션을 우연히 발견하기 위해 행운이 필요하지 않으며 테스트 세트와 일치하는 것을 우연히 발견해야합니다!
통계적으로 구별 할 수없는 모든 최고 팀이 승리하도록 경쟁을 바꿀 수 있습니까? 아니면이 그룹에서 가장 포용 적이거나 계산적으로 저렴한 모델이 이길 수 있습니까?