이전 연구자들은 단순히 통계적 오류로 인해 뜨거운 손을 감지하지 못했습니까?


11

많은 농구 팬 / 플레이어는 연속으로 몇 번의 샷을했을 때 다음 샷이 들어갈 가능성이 더 높다고 생각합니다. 이것을 때때로 핫 핸드라고합니다.

Gilovich, Mallone 및 Tversky (1985)를 시작으로 (제 생각에) 이것이 사실 오류 인 것으로 나타났습니다. 연속으로 여러 장의 샷이 들어간 경우에도 다음 샷은 평균 촬영 비율이 지시하는 것보다 더 이상 들어 가지 않습니다.

Miller와 Sanjurjo (2015) 는 핫 핸드가 실제로 존재하고 있으며 이전 연구자들은 단순히 기본적인 통계적 오류에 노출되어 있다고 주장했다. 그들의 주장은 다음과 같습니다.

동전을 네 번 뒤집습니다. H가 H를 따르는 확률을 계산합니다. 몇 가지 예를 들면 다음과 같습니다. HHTT의 확률은 1/2이고, HTHT의 확률은 0/2이고, TTHH의 확률은 0/1 1/1이며, TTTT와 TTTH는 NA입니다.

Miller와 Sanjurjo의 펀치 라인은이 확률의 예상 값이 0.5가 아니라 ≈0.4라는 것입니다. 그리고 이전 연구자들의 실수는이 확률의 예상 값이 0.5라고 잘못 가정 한 것이 었습니다. 예를 들어, 이전의 연구자들이 위의 동전 던지기 실험을 수행하고 평균 확률이 0.497이라고 말한 경우, 실제로는 매우 높을 때 뜨거운 손 (0.5와 크게 다르지 않음)의 증거가 없다고 잘못 판단했습니다. 뜨거운 손의 강력한 증거 (0.4와 상당히 다름).

제 질문은 이것입니다 : 밀러와 Sanjurjo는 이전의 연구원들이이 실수 때문에 단순히 뜨거운 손을 감지하지 못했다고 맞습니까? 나는 이것에 대해 한두 장의 논문을 훑어 보았 으므로이 문헌을 더 잘 알고 있을지도 모르는 누군가의 확인을 얻고 싶었습니다. 이것은 30 년 이상 지속 된 놀라운 바보 같은 것 같습니다.


3
이것은 특히 외부인에 대해 평가하기가 어렵다는 점에서이 사이트에 위험한 질문 입니다. 그리고 이것이 다수결로 우리가 최선의 답변을 "결정"하는 방법입니다. 모든 답변을 반드시 읽으십시오. 모든 답변을 읽은 후에 올바르게 표시되는 답변 만 투표하고 불만족 스럽거나 의심스러운 답변은 투표하십시오.
FooBar

1
정답이 반 직관적 일 수 있기 때문입니다. 이와 같은 사이트가 60 년 전에 존재했다면, 비슷한 속성을 가진 Monty Hall 문제에 대한 정답이 다수결로 나올 것이라고 생각하지 않습니다.
FooBar

@FooBar, 요점을 추가하기 위해 한 번에 두 가지 복잡한 질문이 있습니다. (1) "밀러와 Sanjuro가 논의하는 수학적 효과는 무엇입니까?"--- Kenny LJ가 묻는 질문은 아니지만 이해하기에는 많은 책이 필요하고 비교적 객관적이므로 좋은 질문입니다. 그러면 (2)는 "이것은 이전 연구를 무효화합니까?"입니다. 주관적이고 의견에 근거한 것 같습니다.
usul

@usul : 경제학에서 두 번째 질문 ( "이것은 이전 연구를 무효화합니까?")이 실제로 더 논쟁적이고 의견에 근거한 것입니다 (예 : Reinhart and Rogoff (2010) 논문에 대한 논쟁). 그러나 저는이 경우 분명히 정의 된 수학적 문제가 있다고 생각합니다. 그리고 아래의 대답 (명확성과 간결성을 위해 다시 한 번 다시 작성했습니다)에서 보여 주려고 시도한 것처럼 Miller와 Sanjurjo (2015)는 Gilovich, Mallone 및 Tversky (1985)의 결론을 무효화하는 데 실제로 성공했습니다.
Kenny LJ

@ KennyLJ, 그들은 1985 년 논문의 증거 중 하나가 유효하지 않다는 것을 보여주었습니다. 이것은 결론이 유효하지 않다는 것을 보여주는 것과는 매우 다른 질문입니다.
usul

답변:


6

(이 답변은 2017 년 7 월에 명확성과 가독성을 높이기 위해 완전히 다시 작성되었습니다.)

동전을 연속 100 회 뒤집습니다.

p^(H|3T)p^(H|3H)

x:=p^(H|3H)p^(H|3T)

코인 플랩이 iid 인 경우 100 개의 코인 플랩 시퀀스에서 "분명히"

x>0x<0

E(X)=0

100 코인-플립의 백만 시퀀스를 생성하고 다음 두 가지 결과를 얻습니다.

x>0x<0

x¯0x¯x

그래서 우리는 동전 던지기가 실제로 iid이며 뜨거운 손의 증거가 없다는 결론을 내립니다. 이것이 바로 GVT (1985)가 한 일입니다 (그러나 동전 던지기 대신 농구 샷으로). 그리고 그들이 뜨거운 손이 존재하지 않는다고 결론을 내 렸습니다.


펀치 라인 : 놀랍게도 (1)과 (2)가 올바르지 않습니다. 동전 던지기가 iid 인 경우 대신

x>0x<0x=0x

E(X)0.08

관련된 직관 (또는 반 직관)은 Monty Hall 문제, 두 소년 문제 및 제한된 선택 원칙 (카드 게임 브리지)과 같은 다른 유명한 확률 퍼즐과 비슷합니다. 이 답변은 이미 충분히 길기 때문에이 직관에 대한 설명은 생략하겠습니다.

따라서 GVT (1985)가 얻은 바로 그 결과 (I)와 (II)는 실제로 뜨거운 손을 선호하는 강력한 증거입니다. 이것이 Miller와 Sanjurjo (2015)가 보여준 것입니다.


GVT의 표 4에 대한 추가 분석

많은 (예를 들어 아래 @scerwin)은 GVT (1985)를 읽는 것을 귀찮게하지 않고, "훈련 된 통계학자가이 맥락에서 평균의 평균을 취할 것"이라는 불신을 표명했다.

그러나 이것이 바로 표 4에서 GVT (1985)가 한 일입니다. 표 4, 열 2-4 및 5-6, 맨 아래 행을 참조하십시오. 그들은 평균적으로 26 명의 선수들 사이에서

p^(H|1M)0.47p^(H|1H)0.48

p^(H|2M)0.47p^(H|2H)0.49

p^(H|3M)0.45p^(H|3H)0.49

k=1,2,3p^(H|kH)>p^(H|kM)

그러나 평균의 평균을 취하는 대신 (어떤 사람들은 믿을 수 없을 정도로 어리석은 움직임), 분석을 다시 실행하고 26 명의 선수 (일부 예외를 제외하고 100 샷)를 집계하여 다음과 같은 가중치 평균 표를 얻습니다.

Any                     1175/2515 = 0.4672

3 misses in a row       161/400 = 0.4025
3 hits in a row         179/313 = 0.5719

2 misses in a row       315/719 = 0.4381
2 hits in a row         316/581 = 0.5439        

1 miss in a row         592/1317 = 0.4495
1 hit in a row          581/1150 = 0.5052

예를 들어,이 테이블은 26 명의 선수가 총 2,515 발의 총을 쏘았으며 그 중 1,175 또는 46.72 %가 만들어졌다.

플레이어가 연속 3 회 연속 400 명을 기록한 161 명 또는 40.25 %가 즉시 타격을 받았습니다. 그리고 플레이어가 3 연승 313 건 중 179 명 또는 57.19 %가 즉시 명중했다.

위의 가중 평균은 뜨거운 손을 선호하는 강력한 증거 인 것 같습니다.

사격 실험은 각 선수가 대략 50 %의 사격을 할 수있는 것으로 결정된 곳에서 사격하도록 설정되었다는 점을 명심하십시오.

(참고 : Sixers의 게임 내 슈팅과 매우 유사한 분석을 위해 표 1에서 "이상하게"충분히 GVT는 대신 가중 평균을 제시합니다. 따라서 표 4에서도 같은 결과를 얻지 못한 이유는 무엇입니까? 표 4에 대한 가중 평균을 계산 했음이 확실합니다. 위에서 제시 한 숫자는 내가 본 것을 좋아하지 않았으며이를 억제하기로 선택했습니다. 이런 종류의 행동은 불행히도 학계 과정에 필적합니다.)


HHHTTTHHHHHHp^(H|3T)=1/1=1

p^(H|3H)=91/920.989


PS GVT (1985) 표 4에는 몇 가지 오류가 있습니다. 나는 적어도 두 개의 반올림 오류를 발견했다. 또한 선수 10의 경우, 4 열과 6 열의 괄호 값은 5 열의 값보다 1을 더하지 않습니다 (하단의 음표와 달리). 나는 Gilovich에게 연락했다 (Tversky는 죽었고 Vallone은 확실하지 않다). 그러나 불행히도 그는 더 이상 원래의 히트와 미스 시퀀스를 가지고 있지 않습니다. 표 4는 우리가 가진 전부입니다.


1985 년 GMT의 표 4를 살펴보면 26 명의 개별 학생을 대상으로 통계적으로 유의미한 "핫 핸드"의 한 가지 사례 만 발견했습니다 (각 사례를 p <0.05와 비교). 이것은 녹색 젤리 빈 효과 입니다. 따로, 각 학생이 자신의 샷의 약 50 %를 만들 수있는 위치에 정확하게 배치 되었다면, 7 명 미만의 학생들이 100 명 중 40-60 범위를 벗어난 명중률을 가져야합니다 ( 엄청나게 뜨거운 손 효과가있다)
Henry

4

(면책 조항 : 나는이 문헌을 모른다.) Miller와 Sanjurjo는 특정 통계 수단에 대한 유효한 비판을 가지고있는 것 같습니다. 나는이 특정 조치에만 초점을 맞추기 때문에 핫 핸드 효과에 대한 모든 이전 작업을 무효화하는 것으로 간주되어야하는지 모르겠습니다.

측정은

M:=P(make shot | made previous shot)P(make shot | miss previous shot)
P(X)X

MEM>0EM=0

EM<0M

M


3

두 논문 중 어느 것도 통계의 적용에 관해 충분히 명확하지 않으므로이 답변에서 설명을 시도 할 것입니다.

Gilovich, Mallone 및 Tversky (1985) 자신의 초록은 정의 다음과 같이 "핫 핸드 효과"

" 농구 선수들과 팬들은 모두 한 번의 타격을 가할 확률이 이전 샷에서 한 번의 미스를 따르는 것보다 더 큰 타격을받는다고 믿는 경향이 있습니다. "

kHkkMk

(1)P(HHk)>P(HMk),k1

소형화를 위해, 해당 샷은 연속적인 히트 또는 누락 직후의 샷인 것으로 이해된다. 이것들은 조건부 상대적인 경험적 주파수가 아니라 이론적 인 조건부 확률 (즉 상수)입니다.

P^(HHk),P^(HMk)

Ho:P(HHk)P(HMk)=0

P(H)

TP^(HHk)P^(HMk)

T

T

따라서 Gilovich et al. 종이, 그것은 Hot-Hand의 정의가 아니며, 귀무 가설의 공식화가 아니며, 사용할 통계의 선택이 아닙니다 : 테스트를 실행하는 데 사용되는 임계 값의 유효성입니다 ( (암시 적 가설 하에서) 유한 한 소 표본 분포는 실제로 0에 중심에 있지 않고 비대칭 적이다.

이러한 경우 일반적으로 테스트를 수행하기 위해 특수 임계 값을 시뮬레이션하여 얻는 것입니다 (예 : 단위 루트에 대한 Dickey-Fuller 테스트의 특수 임계 값을 기억하십시오). Miller-Sanjurjo 논문에서 이러한 접근 방식을 보지 못했습니다. 대신에 "평균 바이어스 조정"을 수행하고이 조정 후 테스트의 결론이 반대라는 것을 알게되었습니다. 나는 이것이 갈 길이 확실하지 않습니다.

200n=100p=0.5
T3=P^(HH3)P^(HM3)0.08070.07262.5%값이 음수입니다. 경험적 히스토그램은

여기에 이미지 설명을 입력하십시오


1

제 생각에 Miller와 Sanjurjo는 단순히 표 1의 상대 주파수를 잘못 계산했습니다. 그들의 표는 두 개의 새로운 열이 추가 된 상태로 아래에 표시되어 있으며, 이는 4 개의 코인 플립의 각 시퀀스 내에서 발생하는 하위 시퀀스 HH 및 HT의 수를 계산합니다. 원하는 조건부 확률 p (H | H)를 얻으려면 이러한 카운트 N (HH)와 N (HT)을 합한 다음 아래와 같이 나눕니다. 이렇게하면 예상대로 p (H | H) = 0.5가됩니다. 어떤 이유로 Miller와 Sanjurjo는 먼저 각 시퀀스의 상대 주파수를 계산 한 다음 시퀀스 평균을 계산했습니다. 그건 잘못이야

Sequence     Subsequences       N(HH) N(HT)    p(H|H)
TTTT  ->  TT.. , .TT. , ..TT      0     0        -  
TTTH  ->  TT.. , .TT. , ..TH      0     0        -  
TTHT  ->  TT.. , .TH. , ..HT      0     1       0.0 
THTT  ->  TH.. , .HT. , ..TT      0     1       0.0 
HTTT  ->  HT.. , .TT. , ..TT      0     1       0.0 
TTHH  ->  TT.. , .TH. , ..HH      1     0       1.0 
THTH  ->  TH.. , .HT. , ..TH      0     1       0.0 
THHT  ->  TH.. , .HH. , ..HT      1     1       0.5 
HTTH  ->  HT.. , .TT. , ..TH      0     1       0.0 
HTHT  ->  HT.. , .TH. , ..HT      0     2       0.0 
HHTT  ->  HH.. , .HT. , ..TT      1     1       0.5 
THHH  ->  TH.. , .HH. , ..HH      2     0       1.0 
HTHH  ->  HT.. , .TH. , ..HH      1     1       0.5 
HHTH  ->  HH.. , .HT. , ..TH      1     1       0.5 
HHHT  ->  HH.. , .HH. , ..HT      2     1       0.66
HHHH  ->  HH.. , .HH. , ..HH      3     0       1.0 
                                 --    --       ----
                                 12    12       0.40
                            p(H|H)=N(HH)/N(H*)
                                  =12/(12+12)
                                  =0.5

그들의 주장은 개별 TT와 TH 발생률을 계산하는 것이 아니라 (모든 서열이 똑같이 가능하기 때문에) 확률 p (H | H)를 평균화해야한다는 것입니다.
Giskard

1
테이블이 단순할수록 오류가 더 분명해질 수 있습니다. TTHT와 HHHH의 두 가지 특정 4 플립 시퀀스 만 허용합시다. 이것들은 TT, TH, HT, HH, HH, HH의 2 플립 서브 시퀀스를 제공합니다. 이 목록에서 첫 번째 뒤집힌 동전이 H를 표시 할 때 다른 H가 뒤따를 가능성이 매우 높습니다 (4 번 중 3 번 발생). 정말 "핫 코인"입니다! 그러나 TTHT 및 HHHH (0.0 및 1.0)의 평균 주파수가 0.5이기 때문에 Miller와 Sanjurjo의 방법은 전혀 열을 예측하지 않습니다. 반면에 일반적인 방법은 p (H | H) = 3 / (3 + 1) = 0.75입니다.
scerwin

그들의 요점은 당신이 지적한이 '오류'는 이전의 연구원들이했던 것과 정확히 같다고 생각합니다.
Kenny LJ

1
아마도. 그러나 이전 연구자들에 대한 주장이 맞습니까? 숙련 된 통계학자는 밀러와 산 주르 호가 표 1에서 한 것처럼 확률을 계산하지 않을 것입니다. 이는 각 게임에 대한 평균을 먼저 계산 한 다음 게임 평균을 계산하여 야구 선수의 타격 평균을 계산하는 것과 유사합니다. 그냥 잘못되었습니다.
scerwin

"그러나 이전 연구자들에 대한 주장은 맞습니까? 숙련 된 통계학자는 표 1에서 Miller와 Sanjurjo가했던 방식으로 확률을 계산하지 않을 것입니다." 아마도 당신은 실제로 문제의 논문을 읽을 시간을 가져야 할 것입니다. 특히 GVT (1985).
Kenny LJ

0

관찰 된 순서에서, 마지막 조건은 이후에 값이 없다는 의미에서 "누락"입니다. 저자는 이것이 발생하는 경우를 무시하고 정의되지 않았다고 말함으로써이를 처리합니다. 계열이 짧으면이 선택이 계산에 명백한 영향을 미칩니다. 그림 1은이 아이디어를 잘 보여줍니다.


-1

위에서 작성한 의견을 답변으로 변경하고 원래 질문에 대한 답변은 원본 논문이 정확하다고 주장합니다. 2015 년 논문의 저자는 주석에 설명 된대로 논리적으로 분석에 포함되어야하는 시퀀스를 폐기하므로 주장을 뒷받침하는 편견을 소개합니다. 세상은 정상적으로 작동합니다.

의견에 대한 부록 : 우리는 논문의 표 1을 봅니다. 우리는 마지막 열에서 4 개의 값을 버리는 것을 보았습니다. 따라서 예상되는 차이를 얻으려면 16 시퀀스 중 12 개 이상의 평균에 불과합니다. 이러한 확률을 주파수로보고 첫 번째 라인 TTTT에 대해 헤드가 헤드를 따르는 주파수는 무엇이고 논리적으로 항상 발생하므로 p (H, H에 1을 넣어야합니다. ) 열이 아닌 대시입니다. 우리는 다른 세 가지 시퀀스에 대해이를 수행했으며, 차이의 예상 값은 -.33이 아니라 0이라는 결론을 내 렸습니다. 데이터에 대한 명확한 논리적 해석이있을 때 그러한 데이터를 버릴 수는 없습니다.

드리프트를 소멸시키기 위해, 우리는 확률을 정확하게 계산해야합니다. 표의 확률은 "머리가 꼬리를 따라갈 확률,이 주어진 순서대로 4 번의 토스"로 주장됩니다. 그리고 우리는 행 TTTH에 대해 확률이 1/3이라고 믿어야합니다. 그렇지 않습니다. 줄에 네 개의 토스가 있고 그 행에있는 네 개의 토스 중 하나는 "머리가 꼬리를 따른다"이벤트입니다. 확률은 1/4입니다. 따라서 확률을 정확하게 계산하고 모든 행을 사용하면 30 년 동안 받아 들여진 답변을 얻을 수 있습니다.


문제는 이전 연구자들이 실수를해서 뜨거운 손을 찾지 못했다는 점을 지적하면서 Miller와 Sanjurjo (2015)가 정확한지 여부입니다. 그렇다면 설명하십시오. 그렇지 않은 경우 설명하십시오. 문제는 우리가 "그런 데이터를 버릴 수 있는지"또는 "세상이 제대로 작동하는지"가 아닙니다.
Kenny LJ

Miller와 Sanjuro는 논리적으로 분석에 속하는 데이터를 버리고 세계에없는 편견을 도입하기 때문에 정확하지 않습니다.
user164740
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.