Wassermann의 All of Statistics를 읽으면서 p- 값의 정의에 미묘한 미묘함이 있음을 알았습니다. 비공식적으로 Wassermann은 p- 값을
[..] 검정 통계량 의 값을 실제로 관찰 한 것과 같거나 더 극단적 으로 관찰 할 확률 ( 하에서 ) .
강조가 추가되었습니다. 좀 더 공식적으로 (Theorem 10.12) :
size test의 형식이
경우에만 거부하십시오 . T ( X n ) ≥ c α
그때,
여기서 은 X ^ n 의 관측 값입니다 . 만약 다음
또한 Wassermann은 Pearson의 검정 (및 기타 검정) 의 p- 값을 다음과 같이 정의합니다 .
설명을 요청하고 싶은 부분 은 첫 번째 정의에서 더 큰 기호 ( )와 두 번째 정의에서 더 큰 기호 ( )입니다. 왜 우리는 \ ge T를 쓰지 않는가 ? " ge 와 같 거나 더 극단적 인 " 의 첫 번째 인용과 일치 할까?
p- 값을 로 계산할 수있을 정도로 편리 합니까? R도 기호 와 함께 정의를 사용합니다 ( 예 : in) .chisq.test
5
검정 통계량이 연속적인 경우 p- 값이 두 정의 모두에 대해 동일하다는 것을 알고 있습니까?
—
mark999
연속 분포에는 문제가되지 않지만 수학적으로 중요하기 때문에 와 의 차이점을 잊어 버리려는 유혹을받지 않아야합니다 . "실제 불일치"로 인해 정확히 의 p- 값이 발생할 수 있기 때문에 응용 프로그램에서도 중요 합니다.
—
Horst Grünbusch