온 전성 검사 : p- 값이 얼마나 낮아질 수 있습니까?


24

두 샘플의 중앙값을 비교하기 위해 순위 합계 테스트를 사용하고 있으며 ( ) 다음과 크게 다릅니다 . 이러한 작은 값 이 의심 스럽거나 매우 큰 표본을 갖는 것과 관련된 높은 통계적 힘에 기인해야합니까? 의심스럽게 낮은 값 과 같은 것이 있습니까?p p=120000p = 1.12E-207


이것은 stats.stackexchange.com/questions/78839 의 복제본입니다 .
amoeba는

답변:


30

(IEEE 배정 밀도 수레를 사용하여) 표준 컴퓨터에서 P-값이 약의 낮은 얻을 수 있습니다 . 효과 크기가 크거나 표준 오류가 낮은 경우 합법적으로 정확한 계산이 가능합니다. T 또는 정규 분포로 계산 한 값은 약 31 표준 오류의 효과 크기에 해당합니다. 표준 오차는 보통 왕복 제곱근 n에 비례하여 0.09 미만의 표준 편차 차이를 반영합니다 (모든 표본이 독립적이라고 가정). 대부분의 응용 프로그램에서 그러한 차이에 대해 의심 스럽거나 특이한 것은 없습니다.10303

그러한 p- 값을 해석하는 것은 또 다른 문제입니다. 작게 번호보기 또는 (10) - (10)을 확률로하는 것은 현실 확률 모델이 뒷받침이 p 값이 계산에서 벗어날 가능성이있는 모든 방법 주어진 이유의 경계를 초과한다. p- 값이 모델이 합리적으로 지원할 수 있다고 생각하는 가장 작은 임계 값보다 작은 것으로보고하는 것이 좋습니다 (종종 0.010.0001 사이) .1020710100.010.0001


13
회의 논문에서 '' ''을 보고했을 때 , 검토자는 APA 지침을 따르기 위해 '' p < 0.001 ''로 변경해야한다고 말했습니다 . p<1026p<0.001
Thomas Levine

4
@ whuber-아름답게 언급되었습니다.
rolando2

2
(+1) 어느 시점에서 정부가 슈퍼 스파이 기술로 원격으로 RAM의 비트를 악의적으로 뒤집어 놓고있을 가능성이 높습니다.
JMS

4
(1) 당신은 실제로 단지 아래로 내려받을 수 IEEE 배정 밀도 부동 소수점. 그러나 p- 값을 계산하기위한 수치 루틴은 그 전에 거의 분리되지 않습니다. 모델링 가정이 완벽하다는 사실을 알지 못하면 (값 은 언제입니까?) p- 값은 일단 샘플이 충분히 커지면 결국 샘플 크기의 척도가됩니다. 5×10324pp
추기경

1
우리가 한계에 대해 모두 잘못이야 @Cardinal : 떨어져 비정규 값에서의 작은 IEEE 이중 기본-2 지수에 대한 열 비트에 해당. 10308
whuber

16

의심 할만한 것은 없습니다. 표본 크기가 클 때 (중앙값을 비교할 때와 같이) p 값이 매우 낮습니다. whuber가 언급했듯이, 일반적으로 이러한 p- 값은 일부 임계 값보다 작은 것으로보고됩니다 (예 : <0.001).

주의해야 할 한 가지는 p- 값이 중간 값의 차이가 통계적으로 유의 한지 여부 만 알려준다는 것 입니다. 차이가 크기가 충분히 큰지 여부를 결정해야합니다. 예를 들어 큰 표본 세트의 경우 평균 / 중앙값의 극소량 차이는 통계적으로 유의할 수 있지만 그다지 큰 의미는 없습니다.


3

p- 값은 0 값을 달성 할 수 있습니다.

θH0:θ=1X=1.1

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.