두 개의 샘플 카이 제곱 테스트


10

이 질문은 Van der Vaart의 저서 Asymptotic Statistics, pg에서 발췌 한 것입니다. 253. # 3 :

및 이 매개 변수 및 갖는 독립 다항식 벡터 라고 가정합니다 . 귀무 가설에서 는XmYn(m,a1,,ak)(n,b1,,bk)ai=bi

i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i
에는 분포가 있습니다. 여기서 입니다.χk12c^i=(Xm,i+Yn,i)/(m+n)

시작하는 데 도움이 필요합니다. 여기서 전략은 무엇입니까? 나는 두 개의 summand를 다음과 같이 결합 할 수있었습니다.

i=1k(mYn,inXm,i)2mn(m+n)c^i

그러나 과 의 가중치 조합이므로 CLT에서는 작동하지 않습니다 . 이것이 올바른 경로인지 확실하지 않습니다. 어떤 제안?XmYn

편집 : 경우 우리가 얻을 수 있기 때문에 매우 쉽습니다.m=n

mYnnXmmn(m+n)=YnXm(m+n)

분자는 다항식 변수 의 차이의 합으로 볼 수 있으므로 CLT를 적용한 다음 같은 장의 정리 17.2로 마무리 할 수 ​​있습니다. 그러나이 상황에서 다른 샘플 크기 로이 문제를 해결하는 방법을 알 수 없습니다. 어떤 도움?(1,a1,,ak)

van der Vaart의 Google 도서 17 장 링크

답변:


6

먼저 몇 가지 표기법. 하자가 및 와 관련된 범주 시퀀스 나타낸다 와 , 즉 . 이라고하자 . 이진화 여기서 는 크로네 커 델타입니다. 그래서 우리는{Xt}1,,m{Yt}1,,nXmYnPr{Xt=i}=ai,Pr{Yt=i}=biN=n+m

Xi=(X1,i,,XN,i)=(δi,X1,,δi,Xn,0,,0)Yi=(Y1,i,,YN,i)=(0,,0,δi,Y1,,δi,Yn)
δi,j1i=j
Xm,i=t=1NXt,i=t=1mδi,XtYn,i=t=1NYt,i=t=1nδi,Yt

이제 우리는 증거를 시작합니다. 먼저 테스트 통계의 두 가지 요약을 결합합니다. 참고 따라서 테스트 통계를

Xm,imc^i=(n+m)Xm,im(Xm,i+Yn,i)n+m=nXm,imYn,in+mYn,inc^i=(n+m)Yn,in(Xm,i+Yn,i)n+m=mYn,inXm,in+m
S=i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i=i=1k(nXm,imYn,i)2(n+m)2mc^i+i=1k(nXm,imYn,i)2(n+m)2nc^i=i=1k(nXm,imYn,i)2nm(n+m)c^i

다음 참고 와 다음 속성

nXm,imYn,i=t=1NnXt,imYt,i=Zi
E[Zi]=nE[Xm,i]mE[Yn,i]=nmainmai=0Var[Zi]=Var[nXm,imYn,i]=n2Var[Xm,i]m2Var[Yn,i]Note Xm,i and Yn,i are independent=n2mai(1ai)+m2nai(1ai)=nm(n+m)ai(1ai)Cov[Zi,Zj]=E[ZiZj]E[Zi]E[Zj]=E[(nXm,imYn,i)(nXm,jmYn,j)]=n2(maiaj+m2aiaj)2n2m2aiaj+m2(naiaj+n2aiaj)=nm(n+m)aiaj

따라서 다변량 CLT에 의해 여기서 , 의 번째 요소 입니다. 이후 Slutsky는 여기서 는 항등 행렬입니다.

1nm(n+m)Z=nXmmYnnm(n+m)DN(0,Σ)
(i,j)Σσij=ai(δijaj)c^=(c^1,,c^k)p(a1,,ak)=a
nXmmYnnm(n+m)c^DN(0,Ikaa)
Ikk×ka=(a1,,ak) . 이후 multiplicty 1 고유치 0 다중성의 고유 한 갖고 (연속 매핑 법칙에 의해 또는 참조 Lemma 17.1, van der Vaart의 정리 17.2)Ikaak1
i=1k(nXm,imYn,i)2nm(n+m)c^iDχk12
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.