p- 값의 두 가지 정의 : 동등성을 증명하는 방법?


11

Larry Wasserman의 저서 인 All of Statistics 를 읽고 현재 p- 값에 대해 읽고 있습니다 (187 페이지). 먼저 몇 가지 정의를 소개하겠습니다 (견적).

R

β(θ)=Pθ(XR)
α=supθΘ0β(θ)
αα

이것은 기본적으로 라고 말합니다 . 크기는 I 형 오류의 "가장 큰"확률입니다. 값은 (I 인용)을 통해 정의됩니다.αp

정의 2 모든 대해 거부 영역 대한 크기 테스트가 있다고 가정합니다 . 그런 다음 여기서 입니다.α(0,1)αRα

p-value=inf{α:T(Xn)Rα}
Xn=(X1,,Xn)

나를 위해 이것은 의미합니다 : 특정 가 주어지면 테스트 및 거부 영역 있으므로 . 를 들어 단순히 모든 이들의 작은 걸릴 - 값 .αRαα=supθΘ0(α)Pθ(T(Xn)Rα)pα

질문 1이 경우라면 임의로 작은 대해 을 명확하게 선택할 수 있습니다 . 정의 2에 대한 나의 잘못된 해석은 무엇입니까, 즉 정확히 무엇을 의미합니까?α=ϵϵ

이제 Wasserman은 연속적이고 값에 대한 "동등한"정의를 가지고있는 정리를 말합니다 .p

정리 검정 의 크기 가 하면 여기서 은 의 관측 값입니다 .α

reject H0T(Xn)cα
p-value=supθΘ0Pθ(T(Xn)T(xn))
xnXn

두 번째 질문은 다음과 같습니다.

질문 2 이 정리를 실제로 어떻게 증명할 수 있습니까? 어쩌면 값 의 정의에 대한 오해 때문일 수도 있지만 이해할 수는 없습니다.p


4
그것은 긍정적이다 이상한 Wasserman 정의 것이라고 "으로 상징하기 때문에," 거의 보편적으로 (즉, 전력 = 1 유형 II 오류율에 사용되는 거의 모든 다른 저자의 논의 전력). 고의로 혼란을 야기시키는 것을 제외하고는 더 나쁜 혼란을 야기 할 수있는 표기법의 선택을 상상하기 어렵다. βββ
Glen_b-복지 주 모니카

1
나는 그것이 이상하다는 것에 동의합니다. 그러나, Casella와 Berger도 같은 일을한다고 생각합니다.
매트 Brems

답변:


6

우리는 분포 에서 알 수없는 매개 변수 얻은 다변량 데이터 있습니다. 참고 샘플 결과입니다.xDθx

우리는 알려지지 않은 매개 변수 에 대한 가설을 테스트하려고 합니다. 귀무 가설 아래 의 값은 세트에 있습니다.θθθ0

의 공간 내에 , 우리는 제거 영역을 정의 할 수 하고, 이 영역의 전원 다음과 같이 정의된다 . 전원이되도록 계산되는 특정 값 확률로 샘플 결과 것을 거부 영역에 때의 값 IS . 분명히 권력은 지역 과 선택한 에 달려 있습니다.XRRPθ¯R=Pθ¯(xR)θ¯θxR θθ¯Rθ¯

정의 1은 영역R크기를 에 대한 의 모든 값의 값으로 정의 하므로 아래 . 분명히 이것은 지역에 따라 다르므로 입니다.Pθ¯Rθ¯θ0θ¯H0αR=supθ¯θ0Pθ¯R

마찬가지로 에 따라 우리는 다른 값 영역 변경이 있고, 이것은 P 값 정의하기위한 기초이다 : 샘플 관측 값이 아직 들어, 영역에 속하는 것으로 변화 영역이 있지만, 이러한 방법으로 각각의 그러한 영역은 계산 앞에서 정의한 바와 같이 상기 상하 한 취 . 따라서 p- 값은 가 포함 된 모든 영역에서 가장 작은 크기입니다 .αRRαRpv(x)=infR|xRαRx

그러면 정리는 단지 '번역'입니다. 즉, 영역 이 통계 사용하여 정의 되고 값 대해 영역 을 . 위의 추론에서 이러한 유형의 영역 을 사용 하면 정리가 따릅니다.RTcRR={x|T(x)c}R

주석 때문에 편집 :

@ user8 : 정리를 위해; 만약 크기 후 거부 정리 영역에서와 같이 거절 영역을 정의하면 세트는처럼 보이는일부 입니다 .αRα={X|T(X)cα}cα

관측 값의 p- 값 찾으려면 , 즉 가장 작은 지역 찾아야 , 즉 가장 큰 값 등이 여전히 포함 하고, 후자는 (영역이 포함 ) 가 정의 된 방식 때문에) 라고 말하는 것과 동일 하므로 가장 큰 그러한xpv(x)Rc{X|T(X)c} xxcT(x)c{X|T(X)c&cT(x)}

물론, 가장 큰 있도록 있어야한다 다음 세트 위에이된다ccT(x)c=T(x){X|T(X)c=T(x)}={X|T(X)T(x)}


답변 주셔서 감사합니다. 정리의 타당성에 대한 질문 : 어떻게 든 이상의 가 없습니까? infα
math

@ user8 : 내 대답 끝에 단락을 추가했습니다. 이제 불충분 한 점이 보입니까?

7

정의 2에서 검정 통계량 의 값은 모든 의 가장 큰 하한값 이므로 가설은 크기의 검정에 대해 기각됩니다 . 리콜는 것을 작은 우리가 만드는 따라서, 우리가 허용되는 유형 I 오류에 대해 덜 허용, 거부 지역 도 감소합니다. 따라서 (매우) 비공식적으로 말하면, 값은 관찰 한 데이터에 대해 을 기각 할 수 있는 가장 작은 입니다. 어느 시점에서 때문에 더 작은 임의로 선택할 수 없습니다.pαααRαpαH0αRα 너무 작아서 관찰 한 이벤트를 제외 (즉, 포함하지 않음)합니다.

이제 위의 관점에서 정리를 다시 생각해 보도록하겠습니다.


나는 아직도 약간 혼란 스럽다. 먼저, 정의 에서 통계량 는 모든 ? "... 언젠가 는 너무 작아서 관찰 한 이벤트를 제외 (즉, 포함하지 못함) 할 것입니다." 경우 완벽하게 정상적으로, 가 관찰 된 샘플을 포함 나던 너무 작아서, 우리는 그나마 거부 . 이것의 문제점은 무엇입니까? 도움 / 인내 주셔서 감사합니다2TαRαRαH0
수학

예. 검정 통계량 는 샘플의 미리 결정된 고정 함수이며,이 의미에서 "고정"은 함수의 형태가 대해 변하지 않음을 의미합니다 . 그것이받는 값은 샘플에 따라 달라질 수 있습니다. 귀하의 문 "우리는 거부하지 귀하의 의견이 잘못된 이유"밝혀 : 정의 , 되는 검정 통계량의 모든 값의 세트 구성 리드 널의 거부로를 . 즉, 레이블이 왜의 "R"배출 --for. 자세한 내용을 설명하기 위해 답변에 업데이트를 게시합니다. TαH0RαR
heropup

빠른 답변과 업데이트 된 버전에 미리 감사드립니다. 내가 의미하는 바는 다음과 같습니다. 우리는 이면 기각합니다 . 여기서 은 관측 된 샘플입니다. 내가 매우 극단적이라고 말하고 매우 작게 선택 하면 주어진 샘플 대해 거부하지 않습니다 . 따라서 작은 는 나쁜 것이 아닙니다. 분명히 한 시점에서 너무 작아서 속하는 샘플을 관찰하는 것은 매우 드 very니다 . 다시 한 번 양해 해 주셔서 감사합니다. 정말 감사합니다! H0T(xn)RαxnRαT(xn)RαH0RαRα
math

2
주어진 p- 값 정의는 표본에 대한 검정 통계량이 명시 적으로 거부 영역에 있어야합니다 . p- 값 정의의 해당 부분을 자유롭게 변경할 수 없습니다.
Glen_b-복지 주 모니카

@Glen_b 댓글 주셔서 감사합니다. 실제로, 나의 이전 의견은 그 정의를 위반합니다. 지적 해 주셔서 감사합니다.
math
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.