NYTimes에서 통계적 방법의 오용에 관한 기사


20

이 기사를 참조하고 있습니다 : http://www.nytimes.com/2011/01/11/science/11esp.html

다음 실험을 고려하십시오. 동전이 머리에 약간 무게가 있다고 믿는 이유가 있다고 가정하십시오. 테스트에서 동전은 1,000에서 527 번 머리 위로 나옵니다.

동전에 가중치가 부여되었다는 중요한 증거입니까?

고전적인 분석은 그렇습니다. 공정한 동전을 사용하면 1,000 플립에서 527 개 이상의 헤드를 얻을 확률은 기존 컷오프의 20 %에서 1 % 또는 5 % 미만입니다. 다시 말해,이 실험은“95 % 신뢰도”의 가중치 동전에 대한 증거를 발견했습니다.

그러나 많은 통계 학자들은 그것을 사지 않습니다. 20 명 중 1 명은 1,000 번의 스 로트에서 526을 넘는 수의 헤드를 얻을 확률입니다. 즉, 플립 핑 확률 527, 플립 핑 확률 528, 529 등의 합이다.

그러나 실험에서 해당 범위의 모든 숫자를 찾지 못했습니다. 이 전문가들은 동전이 가중 될 경우 한 숫자를 얻을 확률 (527)을 계산하고 동전이 동일한 숫자를 얻을 확률과 비교하는 것이 더 정확하다고 말합니다. 공정한.

통계학자인 폴 스펙 크 만 (Paul Speckman)에 따르면, 심리학자 인 제프 루더 (Jeff Rouder)와 함께 통계 학자들은이 비율이 약 4 대 1보다 높을 수 없다는 것을 통계 학자들은 보여줄 수있다.

첫 번째 질문 : 이것은 새로운 것입니다. 정확한 계산을 찾을 수있는 참조가 있거나 정확한 계산을 직접 제공하여 도움을 줄 수 있습니까? 아니면 비슷한 예제를 찾을 수있는 자료를 알려 주시겠습니까?

Bayes는 새로운 증거가 들어 오면서 가설의 가능성을 업데이트하는 방법을 고안했습니다.

따라서 주어진 결과의 강도를 평가할 때 베이지안 (BAYZ-ee-un으로 발음) 분석은 가능한 경우 연구 외부에서 알려진 확률을 포함합니다.

"예, 그렇습니다"효과라고 할 수 있습니다. 금귤이 심장병의 위험을 90 % 감소시키고 치료가 일주일에 알코올 중독을 치료하고 민감한 부모가 소년보다 소녀를 낳을 확률이 두 배 높다는 연구 결과에 따르면 베이지안 반응은 원주민 회의론자 : 예, 그렇습니다. 연구 결과는 세계에서 관찰 할 수있는 것과 비교됩니다.

적어도 하나의 의학 영역 (진단 선별 검사)에서 연구자들은 이미 알려진 확률을 사용하여 새로운 결과를 평가합니다. 예를 들어, 새로운 거짓말 탐지 테스트는 90 % 정확하여 10 개의 거짓말 쟁이 중 9 개를 올바르게 표시합니다. 그러나 이미 거짓말 쟁이 10 마리를 포함하는 것으로 알려진 100 명의 인구에게이 테스트가 제공된다면이 테스트는 훨씬 덜 인상적입니다.

그것은 10 개의 거짓말 쟁이 중 9 개를 올바르게 식별하고 하나를 그리워합니다. 그러나 다른 90 명 중 9 명은 거짓말로 잘못 식별합니다. 소위 진 양성 (9)을 테스트에 표시 한 총 인원 수 (18)로 나누면 정확도는 50 %입니다. "거짓 긍정"및 "거짓 긍정"은 인구에서 알려진 비율에 따라 다릅니다.

두 번째 질문 :이 방법으로 새로운 결과가 "실제"인지 아닌지 어떻게 정확하게 판단합니까? 그리고 : 사전 설정된 사전 확률을 사용하기 때문에 이것이 5 % 장벽만큼 임의적이지 않습니까?


3
공정하고 불공평 한 동전의 경우이 정보가 도움이됩니다. stat.columbia.edu/~gelman/research/published/diceRev2.pdf
mpiktas

답변:


31

첫 번째 질문에 자세하게 답변하겠습니다.

공정한 동전을 사용하면 1,000 플립에서 527 개 이상의 헤드를 얻을 확률은 기존 컷오프의 20 %에서 1 % 또는 5 % 미만입니다.

n=1000p=1/2

((1000,1/2)> =527)

이것은 통계 소프트웨어 패키지로 계산할 수 있습니다. R은 우리에게

> pbinom(526,1000,1/2,lower.tail=FALSE)
   0.04684365

따라서 공정한 동전으로 우리가 526 개 이상의 헤드를 얻을 확률은 약 0.047이며 기사에서 언급 된 5 % 컷 오프에 가깝습니다.

다음 진술

다시 말해,이 실험은“95 % 신뢰도”의 가중치 동전에 대한 증거를 발견했습니다.

논쟁의 여지가 있습니다. 95 % 신뢰는 여러 가지 방식으로 해석 될 수 있기 때문에 나는 그것을 꺼려 할 것입니다.

다음으로 우리는

그러나 실험에서 해당 범위의 모든 숫자를 찾지 못했습니다. 이 전문가들은 동전이 가중 될 경우 한 숫자를 얻을 확률 (527)을 계산하고 동전이 동일한 숫자를 얻을 확률과 비교하는 것이 더 정확하다고 말합니다. 공정한.

(1000,1/2)=527(1000,)=527

((1000,)=527)((1000,1/2)=527)=527(1)473(1/2)1000.

통계학자인 폴 스펙 크 만 (Paul Speckman)에 따르면, 심리학자 인 제프 루더 (Jeff Rouder)와 함께 통계 학자들은이 비율이 약 4 대 1보다 높을 수 없다는 것을 통계 학자들은 보여줄 수있다.

=5271000.

예를 들어 2 차 미분 테스트 를 사용하여 실제로 최대 값인지 확인할 수 있습니다 . 우리가 얻는 공식으로 대체

(527/1000)527(473/1000)473(1/2)10004.3

따라서 비율은 4.3 대 1이며 기사에 동의합니다.


"이제 p와 관련하여이 수량을 최대화하십시오": 나는 당신이 최소화를 의미한다고 생각합니다.
Simon Byrne

@mpiktas (+1) Nice (updated) 답변입니다.
chl

이 예는 신뢰 구간이 정확히 무엇인지 보여줍니다. 신뢰 수준과 동일한 확률 매개 변수를 사용하는 Bernouli 분산 랜덤 변수의 CI 관측 값으로 CI를 해석하는 것이 가장 쉽다는 것을 알았습니다. 실험을 반복적으로 수행하는 경우 CI를 사용하는 것이 좋습니다. 또 다른 문제는 대안 가설이 무엇입니까? p = 7 / 10, p> 0.5, p = 1050 / 2000입니까? p = 527 / 1000? 또 다른 문제는 p = 의미입니다.1212(12±ϵ)ϵ

@Simon, 수정이 최소화되는 이유는 무엇입니까? P 값이 비율을 최대화하지 않습니까?

@statnovice : 답의 원래 버전에는 분자와 분모가 바뀌 었습니다.
Simon Byrne
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.