야구를 따르는 사람은 토론토의 호세 바티스타의 MVP 이외의 성능에 대해 들었을 것입니다. 4 년 전 그는 시즌 당 약 15 홈런을 기록했다. 작년에 그는 54 명을 기록했는데, 이는 야구 역사상 12 명에 불과한 수치입니다.
2010 년에는 240 만 명이 지급되었고 2011 년에는 팀에 1 천 5 백만 명이 요구되었습니다. 760 만 명을 제공하고 있습니다. 그가 2011 년에 그것을 반복 할 수 있다면, 그는 어느 쪽이든 쉽게 가치가있을 것입니다. 그러나 그의 반복 가능성은 무엇입니까? 우리는 그가 그 평균으로 회귀하기를 얼마나 어렵습니까? 우연히 그의 퍼포먼스를 얼마나 기대할 수 있었습니까? 그의 회귀에서 평균으로 조정 된 2010 년 합계는 무엇을 기대할 수 있습니까? 어떻게 해결합니까?
나는 Lahman Baseball Database를 가지고 놀았으며 지난 5 시즌 동안 시즌 당 적어도 50 타석을 기록한 모든 선수의 홈런 합계를 반환하는 쿼리를 짜 냈습니다.
표는 다음과 같습니다 (10 행의 Jose Bautista 알림)
first last hr_2006 hr_2007 hr_2008 hr_2009 hr_2010
1 Bobby Abreu 15 16 20 15 20
2 Garret Anderson 17 16 15 13 2
3 Bronson Arroyo 2 1 1 0 1
4 Garrett Atkins 29 25 21 9 1
5 Brad Ausmus 2 3 3 1 0
6 Jeff Baker 5 4 12 4 4
7 Rod Barajas 11 4 11 19 17
8 Josh Bard 9 5 1 6 3
9 Jason Bartlett 2 5 1 14 4
10 Jose Bautista 16 15 15 13 54
전체 결과 (232 행)는 여기에서 확인할 수 있습니다 .
어디서부터 시작해야할지 모르겠습니다. 누구든지 올바른 방향으로 나를 가리킬 수 있습니까? 관련 이론과 R 명령이 특히 유용합니다.
친절하게 감사합니다
나사 돌리개
참고 :이 예제는 약간 고안되었습니다. 홈런은 확실히 선수의 가치를 나타내는 최고의 지표는 아니며, 홈런 총계는 타자가 홈런을 치는 기회 (판 모양)를 가질 수있는 계절 당 다양한 기회를 고려하지 않습니다. 또한 일부 선수들이 더 유리한 경기장에서 경기하고 리그 평균 홈런이 매년 변화한다는 것을 반영하지도 않습니다. 기타 등 평균에 대한 회귀를 설명하는 배후 이론을 파악할 수 있다면 HR보다 더 적절한 방법으로 사용할 수 있습니다.