가설 검정에서 p- 값 해석


36

나는 최근에 "널 가설 유의성 테스트의 무의미" 논문 인 Jeff Gill (1999)을 보았습니다 . 저자는 가설 검정과 p- 값에 대한 몇 가지 일반적인 오해를 제기했습니다.

  1. p- 값은 기술적으로 이며, 논문에서 지적한 바와 같이 일반적으로 대해서는 아무 것도 알려주지 않습니다 . 우리가 한계 분포를 알지 않는 한 "매일"가설 검정에서는 거의 해당되지 않습니다. 작은 p- 값을 얻고 "널 가설을 기각"하면 대해 아무 것도 말할 수 없기 때문에 우리가 만들고있는 확률론은 정확히 무엇 입니까?P(observation|H0)P(H0|observation)P(H0|observation)
  2. 두 번째 질문은 논문 6 페이지 (652)의 특정 진술과 관련이 있습니다.

별표로 표시되는 p- 값 또는 p- 값의 범위는 사전에 설정되지 않았으므로, 제 1 종 오류가 발생할 가능성은 크지 않지만 일반적으로 그렇게 취급됩니다.

이 진술의 의미를 설명하는 사람이 있습니까?


논문에 대한 TY
Ludovic Kuty

@ ezbentley : 아마 내 대답에 llok을 복용하는 것이 재미있을 수 있습니다 : stats.stackexchange.com/questions/166323/…

답변:


33

(기술적으로, P- 값은 귀무 가설을 고려할 때 적어도 실제로 관측 된 것 보다 극단적 인 데이터 관측 할 확률입니다 .)

Q1. 작은 P 값을 기준으로 귀무 가설을 기각하는 결정은 일반적으로 '피셔의 이탈'에 따라 다릅니다. 희귀 사건이 발생했거나 귀무 가설이 거짓입니다. 실제로 이벤트가 드물기 때문에 null 값이 false 일 가능성이 아니라 P- 값이 알려줍니다.

널이 거짓 일 확률은 베이 즈 정리를 통해서만 실험 데이터로부터 얻을 수 있으며, 이는 널 가정에 대한 '우선'확률 (아마도 길이 "마진 분포"라고 함)을 지정해야합니다.

Q2. 귀하의 질문 의이 부분은 생각보다 훨씬 어렵습니다. 아마도 Gill이 말하는 "P- 값과 오류율에 대해 많은 혼란이 있습니다. 그러나 일반적으로 그렇게 취급됩니다." Fisherian P- 값과 Neyman-Pearsonian 오류율의 조합을 불일치 한 오해라고하며 불행히도 매우 널리 퍼져 있습니다. 여기에 짧은 대답이 완전히 적합하지는 않지만 몇 가지 좋은 논문을 제시 할 수 있습니다 (예, 하나는 내 것입니다). 둘 다 길 종이를 이해하는 데 도움이됩니다.

Hurlbert, S., & Lombardi, C. (2009). Neyman-Pearson 의사 결정 이론 프레임 워크의 최종 붕괴와 신 피셔 인의 등장. Annales Zoologici Fennici, 46 (5), 311–349. (종이로 링크)

Lew, MJ (2012). 약리학 (및 다른 기본 생의학 분야)에서의 나쁜 통계 관행 : 아마도 P. British Journal of Pharmacology, 166 (5), 1559–1567를 모른다. doi : 10.1111 / j.1476-5381.2012.01931.x (용지에 링크)


설명해 주셔서 감사합니다. 기술적으로 다음과 같은 진술을하는 것이 잘못 "the small p-value indicates that the sample mean(or regression coefficient, etc) is significantly different from zero"되었습니까? 혼동의 원인은 귀무가 "거부"된다고 말할 때 귀무 가설에 대한 실제 확률 론적 주장이 이루어지지 않는 것 같습니다.

2
@ ezbentley, 그것은 정말로 당신이 의미하는 바에 따라 다릅니다. 이 단어는 Fisher-Neyman-Pearson 하이브리드에 의해 오염 되었기 때문에 대부분의 상황에서 그다지 의미가 없습니다. 매우 작은 P- 값을 얻은 경우 실제 평균이 0이 아니라고 말할 수 있지만 관측 된 평균이 무엇인지 말하고 변동성 (SEM 또는 신뢰 구간)을 나타내는 것이 중요합니다. 샘플 크기가 무엇인지 말하는 것을 잊지 마십시오. P- 값은 관찰 된 효과 크기의 지정을 대체하지 않습니다.
Michael Lew

설명 감사합니다. Fisher와 Neyman-Pearson 패러다임에 대해 더 깊이 파고 들어야합니다.

@Michael Lew : 아마도 내 대답을 살펴 보는 것이 흥미로울 수도 있습니다 : stats.stackexchange.com/questions/166323/…

Q1의 단락은 아마도 지금까지 본 문제에 대한 최고의 설명 일 것입니다. 감사합니다.
Maxim.K

22

@MichaelLew에게 +1하면 좋은 답변을 제공합니다. 아마도 나는 Q2에 대한 사고 방식을 제공함으로써 여전히 기여할 수 있습니다. 다음 상황을 고려하십시오.

  • 귀무 가설은 사실입니다. 귀무 가설이 참 이 아니면 유형 I 오류가 발생하지 않으며 값의 의미가 무엇인지 명확하지 않습니다 . p
  • α 는 일반적으로 로 설정되었습니다 . 0.05
  • 계산 된p0.01

pp0.02p0.049¯pα

p


1
가설 H_0 = 0이 실제로 사실이라고 믿기가 매우 어려운 현장 (epi)에서 일하면서,이 점을 간과하고 더 많은주의를 기울여야한다고 생각합니다.
boscovich

1
α

1
+1이지만 null이 false 일 때 P- 값의 의미가 명확하지 않다는 제안은 잘못된 것입니다. P- 값이 작을수록 널과 관측 값 간의 불일치가 더 큽니다. 샘플 크기가 클수록 실제 효과 크기가 관찰 된 효과 크기에 가깝다고 가정 할 수 있습니다. 유의성 검정은 추정과 유사하다는 점에 유의하는 것이 좋습니다.
Michael Lew

3
@MichaelLew, 나는 p- 값이 그 자체를 의미하는지 확실하지 않습니다. w / N과 함께 (특히, N을 일정하게 유지함) p가 작을수록 널 (null)과 관측치가 큰 불일치에 해당합니다. 그럼에도 불구하고, 그것은 p가 의미하는 것이 아니라 p에서 추론 할 수있는 것입니다 . 더 큰 N의 관찰 된 효과 크기가 실제 ES에 더 가까워 야한다는 것이 사실이지만, p가 어떤 역할을하는지는 분명하지 않습니다. EG, false null, 실제 효과는 여전히 매우 작을 수 있으며, 큰 N은 관찰 된 ES가 근접 할 것으로 예상하지만 p는 여전히 클 수 있습니다.
gung-복직 모니카

1
...this fallacy shows up in statistics textbooks, as when Canavos and Miller (1999, p.255) stipulate: "If the null hypothesis is true, then a type I error occurs if (due to sampling error) the P-value is less than or equal to $alpha$"α

8

"귀무 가설 유의성 검정의 무의미"와 관련하여 의견을 말하고 싶지만 OP의 질문에 대답하지 않습니다.

pH0H0:{θ=0}θ=ϵϵϵ0ϵ0


3
+1 그렇습니다. 기존의 가설 검정의 실제 문제는 실제로 큰 관심의 증거가 아닌 "차이의 중요한 증거가 있습니까?"라는 대답에 관심이없는 질문에 답한다는 것입니다. ". 물론 실제로 원하는 것은 일반적으로 "나의 연구 가설이 사실 일 확률은 얼마입니까?"이지만 이것은 빈번한 틀 안에서는 대답 할 수 없습니다. 오해는 일반적으로 베이 즈 용어로 빈번한 테스트를 처리하려는 시도에서 발생합니다.
Dikran Marsupial

1
P- 값의 의미와 표본 크기를 분리하는 것은 좋지 않습니다. 더 작은 P- 값은 특정 샘플 크기에서 더 큰 효과 크기를 나타내고, 특정 P- 값에 대해 더 큰 샘플 크기는 실제 효과 크기가 아마도 관찰 된 효과 크기에 더 가깝다는 것을 나타냅니다. 유의성 테스트는 오류가 아닌 추정의 맥락에서 고려해야합니다. 표본이 클수록 항상 더 많은 정보를 제공합니다. 해석 방법은 실험자에게 달려 있습니다. 큰 표본 무시할 수있는 영향 불만은 Neyman-Pearsonian 가설 검정의 문제 일뿐입니다.
Michael Lew
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.