p- 값 미묘 : 더 큰 대 더 큰


11

Wassermann의 All of Statistics를 읽으면서 p- 값의 정의에 미묘한 미묘함이 있음을 알았습니다. 비공식적으로 Wassermann은 p- 값을

[..] 검정 통계량 값을 실제로 관찰 한 것과 같거나 더 극단적 으로 관찰 할 확률 ( 하에서 ) .H0

강조가 추가되었습니다. 좀 더 공식적으로 (Theorem 10.12) :

size test의 형식이α

경우에만 거부하십시오 . T ( X n ) c αH0(엑스)α

그때,

-값=저녁을 먹다θΘ0θ0[(엑스)(엑스)]

여기서 엑스X ^ n 의 관측 값입니다 엑스. 만약 Θ0={θ0} 다음

-값=θ0[(엑스)(엑스)]

또한 Wassermann은 Pearson의 χ2 검정 (및 기타 검정) 의 p- 값을 다음과 같이 정의합니다 .

-값=[χ케이12>].

설명을 요청하고 싶은 부분 은 첫 번째 정의에서 더 큰 기호 ( )와 두 번째 정의에서 더 큰 기호 ( > )입니다. 왜 우리는 \ ge T를 쓰지 않는가 ? " ge 와 같 거나 더 극단적 인 " 첫 번째 인용과 일치 할까?

p- 값을 로 계산할 수있을 정도로 편리 합니까? R도 기호 와 함께 정의를 사용합니다 ( 예 : in) .1에프()>chisq.test


5
검정 통계량이 연속적인 경우 p- 값이 두 정의 모두에 대해 동일하다는 것을 알고 있습니까?
mark999

3
연속 분포에는 문제가되지 않지만 수학적으로 중요하기 때문에 와 의 차이점을 잊어 버리려는 유혹을받지 않아야합니다 . "실제 불일치"로 인해 정확히 의 p- 값이 발생할 수 있기 때문에 응용 프로그램에서도 중요 합니다. <α
Horst Grünbusch

답변:


11

"이상"이 맞습니다.

공식적으로, 분포가 검정 통계량 자체를 획득 할 확률이 양수인 경우, 확률 (및 다른 꼬리의 해당 값과 같은 극단 값)이 p- 값에 포함되어야합니다.

물론, 통계가 연속적 일 때, 정확한 평등 확률은 0 입니다. 또는 라고해도 차이가 없습니다 .>


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.