p- 값이 발견이 우연에 의한 확률이라는 것을 학생들에게 가르치는 것은 왜 나쁜가?


34

누군가 p- 값이 문제라는 것을 학생들에게 가르치는 것이 좋지 않은 이유에 대한 간결한 설명을 제공 할 수 있습니까? 내 이해는 p- 값이 prob라는 것입니다 (더 극단적 인 데이터 얻기 | 귀무 가설이 참임).

나의 진짜 관심은 그들에게 전자가 그것을 말하는 것의 해로움 이다 (단순하지 않다는 사실을 제외하고).


43
잘못 되었기 때문에?
whuber

6
어쩌면 당신이 원하는 것은 잘못이 아니라 나쁜 것을 보여주는 간단한 예일까요?
Karl

2
패트릭은 의견의 여지가없는 일부 사실에 불과하다 . 예를 들어 Pi는 세 가지 ( 법률을 제정하려는 시도 에도 불구하고)와 같지 않다 . 그러나 당신의 의견은 실제로 유용한 설명입니다. 그것은 잘못된 것을 가르치는 것의 해를 묻지 않고 사람들과의 차이점을 설명 할 이유를 찾고 있다는 것을 암시합니다.
whuber

2
stats.stackexchange.com/questions/5591/… 에서 투표율 이 낮은 답글 (IMHO) 중에서도 이러한 문제에 대해 잘 설명하고 있습니다 .
whuber

1
네 칼, 저는 실제 사례를 찾고 있다고 가정합니다. 관측 기반 연구 (예 : 환경 과학, 생태학, 야생 동물 과학)를 다루는 사람들은 훌륭 할 것입니다. 나는 이것을 게시하기 전에 그 스레드 (whuber)를 여러 술집과 함께 읽었습니다. 그래도 감사합니다.
Patrick

답변:


25

@Karl과는 다른 잘못된 진술의 의미에 대한 해석이 다릅니다. 나는 그것이 null에 관한 것이 아니라 데이터에 관한 진술이라고 생각합니다. 우연히 견적을받을 확률을 묻는 것으로 이해합니다. 나는 그것이 무엇을 의미하는지 잘 모르겠습니다. 잘 정의 된 주장이 아닙니다.

그러나 실제 추정치가 특정 값과 같다면 우연히 내 추정치를 얻을 확률이 무엇을 의미하는지 이해합니다. 예를 들어, 평균 키가 실제로 동일하다는 점을 감안할 때 남성과 여성의 평균 키 차이가 매우 큰 것이 무엇을 의미하는지 이해할 수 있습니다. 잘 지정되어 있습니다. 이것이 바로 p- 값이 제공하는 것입니다. 잘못된 문장에서 빠진 것은 널이 참이라는 조건입니다.

이제 우리는 이것이 완벽하지 않다고 반대 할 수도 있습니다 (예를 들어, 추정기의 정확한 값을 얻을 가능성은 0입니다). 그러나 대부분 p- 값을 해석하는 방식보다 훨씬 낫습니다.

가설 검정을 가르 칠 때 반복해서 말하는 핵심 요점은 "1 단계는 귀무 가설이 참이라고 가정하는 것입니다.이 가정에 따라 모든 것이 계산됩니다." 사람들이 그것을 기억한다면 꽤 좋습니다.


오, 나에게 좋아 보인다. 나는 [sigh] (+1)을 알아 채지 않고 같은 요점을하고있는 것을 본다
complexprior

그러나 "해가 무엇입니까"는 무엇입니까?
rolando2

15

나는이 해석을 많이 보았습니다 (아마도 올바른 해석보다 더 자주). "그 결과는 [무작위] 확률로 인한 것입니다"는 " 은 (는) 참" 으로 해석 하므로 실제로는 입니다. 실제로 이어야합니다 ; 말하자면, (당신이 할당 전과 기꺼이과 베이 즈를 할 경우)이 의미있는 진술 할 수있다] "우리가 (데이터)를 본 것을 주어진 유일한 기회가 작동 할 확률은? 무엇인가", 하지만 그것은 P 아니다 -value . H0Pr(H0)Pr(H0|data)

Pr(H0|data) 는 p- 값과 상당히 다를 수 있으므로 p- 값을 그런 식으로 해석하면 잘못 오도 될 수 있습니다.

가장 간단한 예 : 이전의 은 매우 작지만 데이터는 적기 때문에 p- 값은 게으르지 만 (예 : 0.3), 후자는 는 여전히 작습니다. [그러나이 예제는 그리 흥미롭지 않을 것입니다.]Pr(H0)Pr(H0|data)


그래서 Pr (H0 | data) == prob (그들의 발견은 [무작위] 우연 때문입니다)?
Patrick

@ 패트릭-예.
Karl

1
@ 패트릭-아니, 확실히 아닙니다. 고전 가설 검정에서 은 의미가 없습니다. Pr(H0|anything)
whuber

@ whuber-그게 요점입니다. "prob (결과는 [무작위] 우연으로 인한 것입니다" "는 실제로 이며 로 작성해야합니다 . (+ + 베이와 함께) 의미가 있지만 p- 값은 아닙니다. Pr(H0)Pr(H0|data)
Karl

2
흠, 나는 아직도 따르고 있지 않다고 생각하지만, Bayes와 이전 배포판을 호출하여 답장과 의견에 대한 맥락을 제시 한 것에 감사드립니다. 아마도 " "를 " "이 아니라 "데이터"를 의미하는 것으로 해석하기 때문일 수 있습니다. 베이지안 모델에서도 "무 가설은 우연에 의한 것"이라는 개념을 생각하기가 어렵습니다. (베이지안 설정에서, 그 진술은 처음에 아직 가정되지 않은 정보를 추가하지 않을 것입니다 : 모든 가설은 임의의 변수입니다.)H0
whuber

14

나는 (ex) 학생 관점에서 늦은 답변을 추가 할 것입니다 : IMHO 피해는 잘못과 분리 될 수 없습니다.

이러한 유형의 잘못된 "과업 적 근사 / 바로 가기"는 문장을 논리적으로 이해할 수 없다는 것을 인식하는 학생들에게는 혼란을 야기 할 수 있지만, 그들에게 배운 것이 옳다고 가정하면 이해할 수 없다는 것을 깨닫지 못합니다 옳지 않기 때문입니다.

이것은 단지 그들에게 제시된 규칙을 암기하는 학생들에게는 영향을 미치지 않습니다. 그러나 이해를 통해 배우는 학생들은 충분히 능숙해야합니다.

  • 스스로 올바른 해결책에 도달하고
  • 그들이 옳다는 것을 확신 할 수있을 정도로 충분히
  • 그리고 그들이 헛소리라고 배운다고 결론을 내린다.

유효한 교훈적인 지름길이 없다고 말하는 것은 아닙니다. 그러나 IMHO는 그러한 지름길을 취했을 때 이것을 언급해야한다 (예를 들어, "논쟁의 용이성을 위해 우리는 그것을 추정 / 대략 ...").
그러나이 특별한 경우에는 사용하기에 너무 오도 된 것으로 생각합니다.


1
+1 이것은 매우 좋은 점입니다. 학생들에게 잘못된 것을 가르치면, 통계가 어떻게 작동하는지에 대한 모델을 구성하도록 장려하고 강의 계획서에있는 다른 통계 요소를 오해 할 수 있습니다. 예를 들어 어떤 신뢰 구간-학생들이 빈번한 확률이 가설에 첨부 될 수 있다고 생각한다면, 진정한 가치가 특정 구간에 있다는 가설에 적용 할 수없는 이유는 무엇입니까? 이해는 교육의 진정한 목표이며 정확성이 요구됩니다.
Dikran Marsupial

8

질문을 직접 언급하면 ​​해는 어디에 있습니까?

제 생각에는이 질문에 대한 답은 "p- 값은 결과가 무작위 확률에 의한 확률"이라는 진술의 반대에 있습니다. 이것을 믿는다면 아마도 다음을 믿는 것입니다. "[1- (p-value)]는 결과가 무작위 확률에 의한 것이 아닐 확률입니다."

대부분의 사람들의 뇌가 작동하는 방식을 고려할 때이 설명 은 추정 된 매개 변수 의 특정 값 에 얼마나 자신감이 있는지 과대 평가하기 때문에 피해는 두 번째 진술에 있습니다 .


6

다음은 내가 사용하는 간단한 예입니다.

우리의 귀무 가설이 2 머리 동전을 뒤집고 있다고 가정합니다 (따라서 prob (heads) = 1). 이제 우리는 동전을 한 번 뒤집어서 머리를 얻습니다. 이에 대한 p- 값은 1입니다. 따라서 우리는 두 머리 동전을 가질 확률이 100 %입니까?

까다로운 점은 꼬리를 뒤집 으면 p- 값은 0이되고 2- 머리 동전을 가질 확률은 0이되므로이 경우에는 일치하지만 위와는 일치하지 않습니다. 위의 p- 값 1은 우리가 관찰 한 것이 쌍두 동전의 가설과 완벽하게 일치한다는 것을 의미하지만 동전이 쌍두라는 것을 증명하지는 않습니다.

또한 빈번한 통계를 수행하는 경우 귀무 가설은 True 또는 False (무엇인지 알 수 없음)이며 귀무 가설에 대한 (빈번한) 확률 진술은 의미가 없습니다. 가설의 확률에 대해 이야기하려면 적절한 베이지안 통계를 수행하고, 베이지안 확률 정의를 사용하고, 사전으로 시작하여 가설이 참인 사후 확률을 계산하십시오. p- 값을 베이지안 후부와 혼동하지 마십시오.


3

좋아, 또 다른 약간 다른 점이 있습니다.

첫 번째 기본 문제는 "[무작위로 인한] 우연한"이라는 문구입니다. 불특정 한 '기회'에 대한 아이디어는 자연스럽게 학생들에게 제공되지만, 현명한 통계를 수행하는 데있어 불확실성과 재앙에 대해 명확하게 생각하는 것은 위험합니다. 일련의 코인 플립과 같은 방식으로 확률은 0.5 확률로 이항식 설정으로 설명됩니다. 확실한 것은 당연하지만 통계적인 관점에서 0.6 또는 다른 것을 가정하는 것보다 더 자연 스럽지는 않습니다. 그리고 실제 매개 변수를 포함하는 다른 '명백하지 않은'예의 경우 '기회'가 어떻게 보이는지 생각하는 것은 전혀 도움이되지 않습니다.

문제와 관련하여 핵심 아이디어는 H0에 의해 어떤 종류 의 '기회'가 설명되는지, 즉 실제 가능성 / DGP H0 이름이 무엇인지 이해하는 입니다. 일단 그 개념이 확립되면, 학생들은 마침내 '우연히'일어나는 일들에 대해 이야기하는 것을 멈추고 실제로 H0가 무엇인지 묻기 시작합니다. (또한 그들은 다양한 Hs와 일관 될 수 있으므로 역 테스트를 통해 신뢰 구간을 먼저 시작할 수 있음을 알아냅니다.)

두 번째 문제는 피셔의 p- 값 정의로가는 길에 데이터가 H0과의 일관성 측면에서 항상 먼저 설명해야한다는 점입니다. 꼬리 영역은 일종의 '기회'활동으로 (또는 솔직히 해석하기 위해). 이것은 분명히 수사적 강조의 문제이지만 도움이 될 것 같습니다.

요컨대, 사물을 묘사하는 이러한 방식은 그들이 생각하려고 시도하는 사소한 모델로 일반화되지 않을 것입니다. 최악의 경우, 통계 연구가 이미 그런 종류의 묘사가 목표로하는 사람들의 종류에서 이미 생성된다는 미스터리를 더할 수 있습니다.


1

"p- 값은 우연에 의한 영향의 확률"이라고 생각하면 우연에 의한 영향을 의미하는 것으로 보입니다. 그러나 모든 효과는 부분적으로 우연입니다. 임의의 변동성을 통해보아야 할 필요성을 설명하는 통계 수업에서 이것은 매우 마술적이고 지나친 진술입니다. 그것은 p- 값에 가지고 있지 않은 힘을 부여합니다.

특정 경우에 확률을 귀무 가설로 정의하면 p- 값이 귀무 가설로 인해 관측 된 효과가 발생할 확률이 산출됩니다. 그것은 정확한 진술에 끔찍하게 보이지만 확률에 대한 조건이 그 가능성의 원인이라고 주장하는 것은 다시 한 번 넘어집니다. p- 값이 귀무 가설이 참인 경우 효과의 확률이라는 정확한 진술은 귀무 효과를 야기하지 않습니다. 원인은 실제 효과, 효과 주변의 변동성 및 임의 확률을 포함하여 다양합니다. p- 값은 이러한 확률을 측정하지 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.