낮은 p- 값이 널에 대해 더 이상 증거가 아닌 이유는 무엇입니까? Johansson 2011의 주장


31

에서 요한슨 (2011) " 우박 불가능 : P-값, 증거, 그리고 가능성 "(여기 또한 저널 링크 낮은 것을 주) -values 종종 널 (null)에 대한 강력한 증거로 간주됩니다. Johansson 은 통계 테스트가 p-0.45를 출력하는 것보다 p-0.01을 출력하면 null에 대한 증거가 더 강하다고 간주 할 것을 암시합니다 . Johansson은 p- 값을 널에 대한 증거로 사용할 수없는 네 가지 이유를 나열합니다 .pp0.01p0.45p

  1. 는 귀무 가설 하에서 균일하게 분포되므로 귀무에 대한 증거를 절대 나타낼 수 없습니다.p
  2. 는 귀무 가설에만 전적으로 의존하므로 증거는 다른 가설에 대한 가설에 대한 증거이거나 그에 대한 증거라는 의미에서 항상 상대적이기 때문에 증거를 정량화하기에 적합하지 않습니다.p
  3. 는 증거의 강도가 아니라 증거를 얻을 확률 (널을 부여 함)을 나타냅니다.p
  4. 는 관찰되지 않은 자료와 주관적 의도에 의존하며, 따라서 증거 해석으로 볼 때 관찰 된 자료의 증거 강도는 발생하지 않은 것과 주관적 의도에 의존한다는 것을 암시한다.p

불행히도 Johansson의 기사에서 직관적으로 이해할 수 없습니다. 나에게 0.01p-0.45 보다 null이 참일 가능성이 적음을 나타냅니다 . 낮은 p- 값이 null에 대한 강력한 증거가 아닌 이유는 무엇 입니까? p0.01p0.45p


안녕하세요, @luciano! 이 글에 대한 답변을받지 않으 셨습니다. 어떤 답변을 찾고 있습니까? 당신의 질문은 주로 Johannson의 주장에 관한 것이거나 p- 값이 더 낮은 것에 관한 것입니까?
amoeba는 Reinstate Monica

이것은 Fisher vs Neyman-Pearson 잦은 프레임 워크에 관한 것입니다. 이 답변에서 @gung 자세한 내용을 참조하십시오 .
Firebug

답변:


21

그의 주장에 대한 나의 개인적인 평가 :

  1. pp
  2. p
  3. p
  4. ppppp<.05

pp

sq(x)/p(x)>t(s)tsq(x)/p(x)

q(x)p(x)P(q(X)/p(x)>tobsH0)ptobst(s)P(q(X)/p(x)>t(s)H0)=α


6
포인트 3 만 +1. Cox는 p- 값을 우도 비율 (또는 다른 검정 통계량)의 교정으로 설명하며 종종 잊혀지는 관점입니다.
Scortchi-Monica Monica 복원

(+1) 좋은 답변, @Momo. "하지만 그들은 있습니다!"와 같은 것을 추가하여 개선 될 수 있는지 궁금합니다. OP의 제목 질문 "왜 p- 값이 낮을수록 널에 대한 증거가 더 이상 없는가?" 주어진 모든 논증을 파기했지만 제목 질문에 대한 답변을 명시 적으로 제공하지는 않습니다.
amoeba는 Reinstate Monica

1
나는 약간 주저 할 것입니다. 그것은 모두 매우 미묘하고 가정, 상황 등에 매우 의존적입니다. 예를 들어, 확률 론적 진술이 "증거"로 사용될 수 있고 그 진술이 정확하다는 것을 부정 할 수 있습니다. 어부의 관점에서는 그렇지 않습니다. 또한, 나는 모든 주장을 논쟁한다고 말하지 않을 것이다. 나는 단지 다른 관점을 제공하고 논쟁에서 논리적 결함을 지적한다고 생각한다. 저자는 자신의 요점을 잘 주장하고 그 자체로는 똑같이 문제가 될 수있는 적절한 접근 방식에 대한 해결책을 제공하려고합니다.
Momo

9

Johansson과 같은 주장이 너무 자주 재생되는 이유는 P- 값이 널에 대한 증거의 지표이지만 증거의 측정치 가 아니라는 사실과 관련이있는 것 같습니다 . 증거는 단일 숫자로 측정 할 수있는 것보다 더 많은 차원을 가지므로 항상 P- 값과 사람들이 찾기 어려운 증거 사이의 관계 측면이 있습니다.

나는이 논문에서 요한슨에 의해 사용되는 인수의 많은 검토 한 것을 보여줍니다 P-가치와 가능성 기능, 따라서 증거 사이의 관계 : http://arxiv.org/abs/1311.0081 세 번 거절 종이가 지금하고있다 불행하게도, 비록 그들의 주장과 증거는 반박되지 않았다. (Johansson과 같은 의견을 가진 심판이 틀린 것보다는 불쾌한 것 같습니다.)


+1 @Michael Lew, 제목 변경은 어떻습니까? P (ee) 또는 P (ee)에게 ... 딜 렘나처럼 들리지 않습니다. 우리는 모두 그 상황에서해야 할 일을 알고 있습니다. = D 농담을 제외하고, 논문이 거부 된 이유는 무엇입니까?
바다에있는 노인.

4

@Momo의 좋은 대답에 추가 :

1


2
증거에 대한 응답이 변경 되더라도 증거 자체는 여러 가지 테스트에 의해 영향을받지 않습니다. 데이터의 증거는 데이터의 증거이며 컴퓨터에서 수행 할 수있는 계산의 영향을받지 않습니다. 다중 검정에 대한 p- 값의 일반적인 '수정'은 p- 값과 실험적 증거 사이의 관계를 수정하지 않고 오 탐지 오류율을 유지하는 것과 관련이 있습니다.
Michael Lew

1

Johansson은 두 가지 다른 실험에서 나온 p- 값에 대해 이야기하고 있습니까? 그렇다면 p- 값을 비교하는 것은 사과를 양고기와 비교하는 것과 같습니다. 실험 "A"에 많은 수의 샘플이 포함 된 경우 작은 차이도 통계적으로 유의할 수 있습니다. 실험 "B"에 몇 개의 샘플 만 포함 된 경우 중요한 차이가 통계적으로 중요하지 않을 수 있습니다. 더 나쁜 것은 (그것이 내가 오렌지가 아니라 양고기를 말한 이유입니다), 비늘은 완전히 비교할 수 없을 수도 있습니다 (하나는 psi이고 다른 하나는 kwh).


3
내 생각에 Johansson은 다른 실험의 p- 값을 비교하는 것에 대해 이야기하고 있지 않습니다. 그 & @Glen_b의 의견에 비추어, 글을 명확하게 설명해 주시겠습니까, Emil? 관련 포인트를 올리는 것이 좋습니다 ( '컨텍스트 A에서는 J가 잘못되었다고 생각하지만 컨텍스트 B에는 약간의 장점이 있습니다').하지만 그것이 당신이하고있는 것임을 분명히해야합니다. 당신이 경우에 하는 질문을하거나 의견을,이 게시물을 삭제 및 그것을 코멘트 확인하시기 바랍니다.
gung-모니 티 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.