비대칭 널 분포를 사용한 2- 테일 검정의 P- 값


18

내 상황은 다음과 같습니다. Monte-Carlo 연구 를 통해 추정 된 모수의 통계적 유의성에 대해 두 가지 다른 테스트의 을 비교하려고합니다 (널은 "효과 없음-모수는 0"이며 내재 된 대안은 " 매개 변수가 0이 아닙니다 "). 검정 A 는 표준 "균등도에 대한 독립적 인 2- 표본 t 검정" 이며, 널 미만의 분산은 동일합니다. p

테스트 B 나는 나 자신을 만들었다. 여기서 사용 된 널 분포는 비대칭 일반 이산 분포입니다. 그러나 나는 Rohatgi & Saleh (2001, 2nd ed, p. 462) 에서 다음과 같은 의견을 발견했습니다 .

"분포가 대칭이 아닌 경우, 값은 양면 경우에 잘 정의되어 있지 않지만 많은 저자는 단측 값을 두 배로 늘리는 것이 좋습니다pp . "

저자는 이에 대해 더 이상 논의하지 않으며, 단측 값 을 두 배로 늘리기 위해 "많은 저자 제안"에 대해 언급하지 않습니다 . (이것은 " 어느 쪽 의 값의 두 배 입니까? 그리고 왜이 쪽이 아닌 다른 쪽입니까? "라는 질문을 만듭니다 .)pp

이 모든 문제에 대한 다른 의견, 의견 또는 결과를 찾을 수 없었습니다. 매개 변수의 값과 관련하여 귀무 가설 주위의 간격 대칭을 고려할 수 있지만 비대칭 분포를 사용하면 두 번째 일반적인 대칭, 확률 질량 할당의 대칭이 없습니다. 그러나 이것이 왜 값이 "잘 정의되지 않음" 인지 이해하지 못합니다 . 개인적으로 추정기 값에 대해 귀무 가설 주위에 대칭을 사용하여 간격을 사용하면 정의가 없습니다.p"널 분포가이 구간의 경계와 같거나 그 밖의 값을 생성 할 확률은 XX입니다." 한쪽의 확률 질량이 다른 쪽의 확률 질량과 다를 것이라는 사실은 적어도 내 목적으로는 문제를 일으키는 것으로 보이지 않습니다. 그러나 Rohatgi & Saleh가 내가 모르는 것을 아는 것보다 오히려 가능성이 높습니다.

그래서 이것은 내 질문입니다 : null 분포가 대칭이 아닌 양면 테스트의 경우 값이 "정의되지 않은"것은 무엇입니까?p

아마도 중요한 참고 사항 : 나는 어부 정신 으로이 문제에 더 가까이 다가 가고, 나는 Neyman-Pearson 의미에서 엄격한 결정 규칙을 얻으려고하지 않습니다. 나는 값 정보를 다른 정보와 함께 사용하여 추론하기 위해 테스트 사용자에게 맡깁니다.p


4
우도 기반 ( "Fisherian") 및 LR 기반 (NP) 접근 외에도 다른 방법은 짧은 신뢰 구간 을 얻는 방법을 고려 하고 가설 검정에 사용합니다. 이것은 손실 이론에 길이가 포함 된 의사 결정 이론 (및 그 방법을 사용하는)의 정신으로 이루어집니다. 검정 통계량의 단일 대칭 분포의 경우, 가장 짧은 가능한 구간은 대칭 구간을 사용하여 얻을 수 있습니다 (단일 검정의 "p- 값 배가"). 최단 길이 간격은 매개 변수화에 따라 다르므로 Fisherian이 될 수 없습니다.
whuber

여기에 게시 된 답변이 베타 배포에도 적용되는지 궁금합니다. 감사.
JLT

@ JLT : 예, 왜 안되나요?
Scortchi-Monica Monica 복원

답변:


12

우리가 2x2 정확한 테스트를보고 그것을 우리의 접근 방식으로 취한다면, "더 극단적 인"것은 "낮은 가능성"에 의해 직접 측정 될 수 있습니다. (Agresti [1]은 다양한 저자들이 2x2 Fisher 정확한 테스트의 경우에만 두 개의 꼬리 p- 값을 계산하기위한 여러 가지 접근법을 언급하며 ,이 접근법은 특히 '가장 인기있는'세 가지 중 하나입니다.)

연속 (단일) 분포의 경우 표본 값과 밀도가 같은 다른 꼬리의 점만 찾으면 다른 꼬리의 가능성이 같거나 낮은 모든 것이 p- 값 계산에 포함됩니다.

꼬리에서 단조롭게 증가하지 않는 불연속 분포의 경우 거의 간단합니다. 당신은 단지 샘플과 같거나 낮은 가능성을 가진 모든 것을 셀 수 있습니다. 여기에 내가 추가 한 가정 ( "꼬리"라는 용어를 아이디어에 적합하게 함)을 고려하면 그것을 해결할 방법이 있습니다.

HPD 간격에 익숙한 경우 (그리고 다시 한 번 모달리티를 다루는 경우) 기본적으로 표본 통계량에 따라 한쪽 꼬리에 묶인 열린 HPD 간격을 벗어나는 모든 것을 취하는 것과 같습니다.

여기에 이미지 설명을 입력하십시오

[반복하기 위해-이것은 우리가 여기에서 말하는 null 아래 가능성입니다.]

따라서 적어도 단조로운 경우에는 Fisher의 정확한 테스트를 모방하고 여전히 두 개의 꼬리에 대해 이야기하는 것만 큼 간단합니다.

그러나 이런 방식으로 Fisher의 정확한 테스트 정신을 불러 일으키지 않았을 수도 있습니다.

그래서 무언가를 '더 이상 또는 더 극단적 인'것으로 만드는 것에 대한 생각 밖에서 네이 먼-피어슨의 끝을 향해 조금 더 나아가 보자. 일반적인 수준 에서 수행 된 테스트에 대해 거부 영역 정의에 대해 설정하는 것이 도움이 될 수 있습니다 ( 문자 그대로 계산해야하는 것은 아니며, 계산 방법 만 의미 함). 귀하가하는 즉시 귀하의 사례에 대해 두 개의 꼬리 p- 값을 계산하는 방법이 분명 해져야합니다.α

이 방법은 일반적인 우도 비 테스트 외부에서 테스트를 수행하는 경우에도 유용 할 수 있습니다. 일부 응용 프로그램의 경우 비대칭 순열 테스트에서 p- 값을 계산하는 방법을 알아내는 것이 까다로울 수 있지만 거부 규칙을 먼저 생각하면 상당히 단순 해집니다.

F- 분산 검정을 통해 "더블 원 테일 p- 값"이 올바른 접근법으로 보는 것과는 상당히 다른 p- 값을 제공 할 수 있음을 알게되었습니다. [어떤 그룹을 "샘플 1"이라고 부르는지, 또는 분자에 분산을 더 큰지 작은지를 넣을지는 중요하지 않습니다.]

[1] : Agresti, A. (1992), 비 상대 통계표에
대한 정확한 추론 조사 , Vol. 7 , No. 1. (2 월), pp. 131-153.


1
ctd ... 우도 비율 테스트를 수행하는 경우 우도 비율은 항상 단측이지만 통계를 기반으로 동등한 양측 테일 검정을 구성하면 "더 극단적 인"위치를 찾기 위해 더 작은 우도 비율을 찾습니다.
Glen_b-복지 모니카

2
단측 p- 값을 두 배로 늘리는 것은 두 개의 단측 테스트를 수행하는 Bonferroni 수정으로 방어 될 수 있습니다. 결국, 양측 테스트 후, 우리는 일반적으로 데이터에 의해 방향이 결정되는 또 다른 가설을 선호하는 것으로 귀무의 진실에 대한 의심을 고려하는 경향이 있습니다.
Scortchi-Monica Monica 복원

1
@Alecos 대칭 선택을 정당화하기에 충분히 간단합니다! 대칭 선택이 올바른 방법이 아니라고 제안한 내용을 어떻게 읽었는지 알기가 어렵습니다. (거부 선택은 거부 규칙에 대한 토론에서 다룹니다. 대칭을 쉽게 구성 할 수 있습니다. 거부 규칙). 내 대답의 첫 번째 부분은 Fisher에 관한 질문의 부분에 응답했습니다. Fisher에 대해 문의하는 경우 비슷한 상황에서 수행 한 작업을 기반으로 Fisher가 수행 할 수있는 작업에 대해 논의하지 않아야합니까? 당신은 내 대답을 그 이상으로 말하는 것으로 해석하는 것 같습니다.
Glen_b-복지 주 모니카

1
@Alecos 특히, 나는 Fisher 또는 Neyman Pearson 접근법을 옹호하지 않습니다 (우리는 가능성 비율 테스트 또는 가설 검정에 대해 더 일반적으로 이야기하든), 내가 생략 한 것이 잘못 될 수 있다고 제안하려고 생각해야합니까 . 나는 당신이 당신의 질문에서 제기하고있는 것처럼 보이는 많은 것들을 논의하고 있습니다.
Glen_b-복지 주 모니카

2
궁극적으로 그렇습니다. Fisher의 접근 방식에 대한 깔끔한 점은 대안이 없어도 p- 값에 도달하는 매우 합리적인 방법을 제공한다는 것입니다. 그러나 관심있는 특정 대안이있는 경우 대안이 샘플을 거부 지역으로 두는 경향이있는 샘플 공간 부분을 선언하여 거부 지역을 대체 할 수 있습니다. 검정 통계량 T는 본질적으로 단일 숫자를 각 점과 연관시켜 (T에 의해 측정 된 '더 극단적 인'것으로)이를 달성하는 편리한 방법입니다. ... ctd
Glen_b-복지국 Monica

9

p- 값은 표본 공간을 분할하고 귀무 가설과의 불일치 증가 개념에 따라 분할을 주문하는 검정 통계량을 작성하면 잘 정의됩니다. (또는 크기가 감소하는 중첩 된 거부 영역 집합을 만들면 동등하게 나타납니다.) 따라서 R. & S.가 얻는 것은 통계 의 높거나 낮은 값이 null과 흥미롭게 일치하지 않는다고 생각하면 가설 아직 적절한 검정 통계량 T 를 얻기 위해 약간의 노력을 기울이고 있습니다 . 때 S가 제로 주위에 대칭 분포 그들은 도약하는 것 T = | S | 많은 생각없이 & 따라서 비대칭 사례를 퍼즐을 제시하는 것으로 간주하십시오.STST=|S|

t=min(PrH0(S<s),PrH0(S>s))S2t

SST=fS(S)X1.661.66

p=Pr(X>1.66)+Pr(X<1.66)=0.048457+0.048457=0.09691.
Ye1.66=5.25930.025732=e3.66
p=Pr(Y>5.2593)+Pr(Y<0.025732)=0.048457+0.00012611=0.04858.

여기에 이미지 설명을 입력하십시오

p=2t=2min(Pr(X<1.66),Pr(X>1.66))=2min(Pr(Y<5.2593),Pr(Y>5.2593))=2min(0.048457,0.951543)=2×0.048457=0.09691.

대안 적 가설이 명시 적으로 언급 된 테스트 구성의 일부 원리를 논의하는이 답변의 속편은 여기 에서 찾을 수 있습니다 .

S

pL=PrH0(Ss)
pU=PrH0(Ss)

하측 및 상측 단측 p- 값의 경우 양측 p- 값은

Pr(Tt)={pL+PrH0(PUpL)when pLpUpU+PrH0(PLpU)otherwise

2t


1
오 와우. 이것은 좋은 지적입니다, +1. 그러면 당신의 조언은 무엇입니까? 또한이 불일치를 테스트 통계의 다른 (이 경우에는 암시적인) 선택에 해당하는 것으로 해석 할 수 있습니까?
amoeba는

1
@amoeba : 오타가 아닙니다! 그리고 1.66을 관찰하면 최소 0.952 & 0.048을 취합니다. 실제로 -3.66을 관찰 한 경우 최소 0.0001 및 0.9999입니다.
Scortchi-Monica Monica 복원

1
@Scortchi 좁은 의미에서 저에게 "유용한"것이기 때문에 Glen_b의 대답을 방금 받아 들였습니다. 그러나 귀하의 도움으로 "그게 전부입니다"라는 생각의 함정 을 피할 수 있었습니다. 이는 미래의 위험에 대한 훌륭한 보험 정책입니다. 다시 감사합니다.
Alecos Papadopoulos

1
@Scortchi 동의해야합니다; 제 답변은 다소 단순하고 일방적 인 견해를 취했으며 답변을 검증, 확장 및 정당화해야합니다. 아마 여러 단계에서 그렇게 할 것입니다.
Glen_b-복지국 Monica

1
@ Glen_b : 감사합니다. 기대합니다. 또한 점수 테스트와 일반화 가능성 비율 테스트가 어떻게 다른 답변을 제공하는지 보여주기 위해 광산을 확장하고 싶습니다. & 편견없는 테스트 이론은 반드시이 맥락에서 언급 할 가치가 있습니다 (그러나 나는 그것을 거의 기억할 수 없습니다).
Scortchi-복원 Monica Monica
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.