다른 답변과 달리 사용 가능한 데이터가 주어지면 볼트 능력에 대해 말할 수 있다고 주장합니다. 우선, 질문을 좁히십시오. 당신은 가장 빠른 인간을 요구하고 있지만, 최고의 여성 주자 여성이 최고의 남성 주자보다 약간 느린 것처럼 보이는 남성과 여성의 달리기 속도 분포에 차이가 있기 때문에 우리는 남성 주자에 중점을 두어야합니다. 일부 데이터를 얻으려면 지난 45 년 동안 100 회 실행 한 최고의 연도 실적을 볼 수 있습니다 . 이 데이터에 대해주의해야 할 사항이 몇 가지 있습니다.
- 그 시간은 최고의 달리기 시간이므로 모든 인간의 능력에 대한 것이 아니라 달성 된 최소 속도 에 대해 알려줍니다 .
- 이 데이터는 세계 최고의 러너 샘플을 반영한다고 가정합니다. 챔피언십에 참여하지 않은 더 나은 주자가 있었을 수도 있지만,이 가정은 상당히 합리적입니다.
먼저이 데이터를 분석 하지 않는 방법에 대해 설명하겠습니다 . 시간에 대한 실행 시간을 플롯하면 강한 선형 관계를 볼 수 있습니다.
이것은 선형 회귀를 사용하여 다음 해에 우리가 얼마나 더 나은 주자를 관찰 할 수 있는지 예측할 수있게합니다. 그러나 이것은 매우 나쁜 생각이 될 것입니다. 그것은 약 2 천년 안에 인간은 0 초 안에 100 미터를 달릴 수 있고 그 후에는 부정적인 실행 시간을 달성하기 시작한다는 결론으로 이어질 것입니다! 우리의 능력에는 생물학적, 물리적 한계가 있으며, 우리에게 알려지지 않은 것으로 상상할 수 있기 때문에 이것은 분명히 터무니없는 것입니다.
이 데이터를 어떻게 분석 할 수 있습니까? 먼저 최소값에 대한 데이터를 다루고 있으므로 해당 데이터에 적절한 모델을 사용해야합니다. 이를 통해 우리는 극단적 인 가치 이론 모델 을 고려하게됩니다 (예 : Stuart Coles 의 통계적 모델링에 대한 소개 책 참조). 이 데이터에 대해 일반화 된 극값 분포 (GEV)를 가정 할 수 있습니다 . 만약 여기서 독립적이고 동일하게 분산 된 랜덤 변수이며, 다음 의은 GEV 분포를 따른다. 미니 마 모델링에 관심이있는 경우 가 샘플 인 경우Y=max(X1,X2,…,Xn)X1,X2,…,XnYiZ1,Z2,…,Zk−Zi미니 마에 대한 GEV 배포판을 따릅니다. 따라서 GEV 분포를 주행 속도 데이터에 맞출 수 있으며, 이는 매우 잘 맞습니다 (아래 참조).
모델에서 제안한 누적 분포를 보면 Usain Bolt의 최고의 실행 시간이 최저 임을 알 수 있습니다.1%분포의 꼬리. 따라서 우리가이 데이터와이 장난감 예제 분석을 고수한다면 훨씬 작은 실행 시간은 거의 없을 것입니다 (그러나 분명히 가능합니다). 이 분석의 명백한 문제는 우리가 최고의 실행 시간을 매년 개선한다는 사실을 무시한다는 것입니다. 이것은 답의 첫 부분에서 설명 된 문제, 즉 여기서 회귀 모형을 가정하는 것이 위험하다는 가정으로 되돌아갑니다. 개선 될 수있는 또 다른 것은 아직 베이지안 접근 방식을 사용하고 생리 학적으로 가능한 실행 시간에 대한 데이터에 대한 지식이 부족하지만 아직 관찰되지 않았을 수있는 유익한 정보를 가정 할 수 있다는 것입니다. 현재로서는 알려져 있지 않습니다). 마지막으로, 유사한 극단적 가치 이론이 이미 스포츠 연구에 사용되었다. 예를 들어 Einmahl and Magnus (2008)는극한 가치 이론 논문을 통한 육상 기록 .
당신은 당신이 더 빠른 달리기 시간의 가능성에 대해 묻지 않고 더 빠른 주자를 관찰 할 가능성에 대해 물었다는 것에 항의 할 수 있습니다. 불행히도, 우리는 러너가 프로 운동 선수가 될 확률을 모르고 기록 된 러닝 타임을 사용할 수 있기 때문에 많은 것을 할 수 없습니다. 이것은 무작위로 발생하지 않으며 일부 주자는 프로 운동 선수가되고 일부는 그렇지 않은 사람 (또는 누군가가 달리기와 달리기를 좋아하는 사람)에 기여하는 많은 요인이 있습니다. 이를 위해서는 러너에 대한 자세한 인구 전체 데이터가 필요합니다. 또한 배포의 극단에 대해 문의하기 때문에 데이터가 매우 커야합니다. 그래서 이것에 대해서는 다른 답변에 동의합니다.