정말 오래된 질문에 답하는 것만 큼 좋은 것은 아니지만 여기에갑니다 ...
p- 값은 거의 유효한 가설 검정입니다. 이것은 Jaynes의 2003 년 확률 이론 책 (반복 실험 : 확률과 빈도)에서 가져온 약간 수정 된 발췌문입니다. 테스트하려는 귀무 가설 이 있다고 가정 합니다. 데이터 D 와 사전 정보 I가 있습니다. 우리가 H 0 에 대해 테스트 할 지정되지 않은 가설 H A 가 있다고 가정합니다 . 위한 후방 교차비 H 대하여 H 0는 다음에 의해 주어진다 :H0DIHAH0HAH0
P(HA|DI)P(H0|DI)=P(HA|I)P(H0|I)×P(D|HAI)P(D|H0I)
이제 오른쪽의 첫 번째 항은 데이터와 무관하므로 데이터는 두 번째 항을 통해서만 결과에 영향을 줄 수 있습니다. 이제, 우리는 항상 대립 가설 발명 할 수 있도록 P ( D | H 내가 ) = 1 은 "완벽하게 맞지는"가설을 -. 따라서 우리는 1 을 사용할 수 있습니다HAP(D|HAI)=1데이터가 널 (null)에 대한 대체 가설을 얼마나 잘 지원할 수 있는지에 대한 척도 인 P ( D | H 0 I ) . 데이터가1보다 큰H0을지원할 수 있다는 가설은 없습니다.1P(D|H0I)H0 . 또한 대안의 클래스를 제한 할 수 있으며, 그 변화는1이 해당 클래스 내에서 최대화 된 가능성 (정규화 상수 포함)으로 대체된다는 것입니다. 경우P(D|H0내가)너무 작아 시작과 대안의 수 있기 때문에, 우리는 널을 의심하기 시작H0과H, A는(무시할 사전 확률 일부 포함) 성장한다. 우리의 확률 계산하지 않는 :하지만이 그래서 매우 거의 무슨 일이 P-값으로 수행하지만, 한 가지 예외가t을(1P(D|H0I)1P(D|H0I)H0HA통계의 일부 통계 t ( D ) 및 일부 "나쁜"영역의 경우 D ) > t 0 우리는 우리가 실제로 가지고있는 정보 인 t ( D )가 아닌 D에 대한 확률을 계산한다.t(D)>t0t(D)Dt(D)
D≡{x1,…,xN}xi∼Normal(μ,σ2)IH0:μ=μ0. 그런 다음 약간의 계산 후에
P(D|H0I)=(2πσ2)−N2exp(−N[s2+(x¯¯¯−μ0)2]2σ2)
x¯¯¯=1N∑Ni=1xis2=1N∑Ni=1(xi−x¯¯¯)2P(D|H0I)μ0=x¯¯¯
P(D|HAI)=(2πσ2)−N2exp(−Ns22σ2)
그래서 우리는이 두 가지의 비율을 취합니다.
P(D|HAI)P(D|H0I)=(2πσ2)−N2exp(−Ns22σ2)(2πσ2)−N2exp(−Ns2+N(x¯¯¯−μ0)22σ2)=exp(z22)
z=N−−√x¯¯¯−μ0σ|z|x¯¯¯
x¯¯¯X¯¯¯¯∼Normal(μ,σ2N)X¯¯¯¯x¯¯¯|X¯¯¯¯−μ0||X¯¯¯¯−μ0|≥|x¯¯¯−μ0|
p-value=P(|X¯¯¯¯−μ0|≥|x¯¯¯−μ0||H0)
=1−P[−N−−√|x¯¯¯−μ0|σ≤N−−√X¯¯¯¯−μ0σ≤N−−√|x¯¯¯−μ0|σ|H0]
=1−P(−|z|≤Z≤|z||H0)=2[1−Φ(|z|)]
|z|
이 예제에서는 두 가지 모두 쉬운 일이지만 더 복잡한 경우에는 항상 쉬운 것은 아닙니다. 경우에 따라 샘플링 통계를 사용하고 계산할 올바른 통계를 선택하는 것이 더 쉬울 수 있습니다. 다른 대안에서는 대안의 클래스를 정의하고 해당 클래스를 최대화하는 것이 더 쉬울 수 있습니다.
이 간단한 예제는 많은 p- 값 기반 테스트를 설명하는데, 그 이유는 많은 가설 테스트가 "대략 정상적인"다양성이기 때문입니다. 그것은 동전 문제에 대한 대략적인 답변을 제공합니다 (이항에 대한 일반적인 근사법을 사용하여). 또한이 경우 p- 값이 최소한 단일 가설 검정의 관점에서 당신을 타락시키지 않을 것임을 보여줍니다. 이 경우 p- 값이 귀무 가설에 대한 증거의 척도라고 말할 수 있습니다.
0.193.870.05196.830.12.330.052.78