어떤 수준에서입니다


15

배경 : 안전하게 건너 뛰십시오-참조를 위해 여기 있으며 질문을 정당화합니다.

문서 의 시작 부분은 다음 과 같습니다.

"Karl Pearson의 유명한 카이-제곱 비상 테스트는 정규 분포를 기반으로하는 z 통계라고하는 다른 통계량에서 파생됩니다. 가장 간단한 버전의 χ2 는 수학적으로 동일한 z 테스트와 동일한 것으로 표시 될 수 있습니다.이 테스트는 동일한 결과를 생성합니다. 모든 상황에서. 모든 의도와 목적은 "카이 제곱"은 "Z-제곱"이라고 할 수있다.의 중요한 값 χ2 하나의 자유도에 대한이 Z의 대응하는 중요한 값의 제곱입니다. "

이것은 CV ( 여기 , 여기 , 여기 및 기타) 에서 여러 번 주장되었습니다 .

그리고 실제로 우리가 할 수 증명 하는 XN(0,1) 인X2와같습니다.χ1df2X2XN(0,1)

하자 말하자면 그 와 그 Y = X (2) 과의 밀도 찾는 Y를 사용하여 C의 D를 f를 방법XN(0,1)Y=X2Ycdf

. 문제는 정규 분포의 밀도를 밀접하게 통합 할 수 없다는 것입니다. 그러나 우리는 그것을 표현할 수 있습니다.p(Yy)=p(X2y)=p(yxy)

파생 상품을 복용 :

FX(y)=FX(y)FX(y).

fX(y)=FX(y)12y+FX(y)12y.

정규 은 대칭 이므로 다음과 같습니다.pdf

. 받는이 동일시P의개발F정상 (지금의X에서P의개발F하는fX(y)=FX(y)1ypdfxpdfex 2에 연결y정상의 2 부분pdf); 포함하는 것을 기억1ex22pdf끝에 y :1y

fX(y)=FX(y)1y=12πey21y=12πey2y121

카이 제곱의 pdf와 비교 :

fX(x)=12ν/2Γ(ν2)ex2xν21

이후 ,1df의 경우 카이 제곱의pdf를정확하게 도출했습니다.Γ(1/2)=π1pdf

또한 prop.test()R 에서 함수 를 호출 하면 우리가 결정 하는 것과 동일한 테스트를 호출합니다 .χ2chisq.test()

질문:

그래서 나는이 모든 포인트를 얻었지만 여전히 두 가지 이유로이 두 가지 테스트의 실제 구현에 어떻게 적용되는지 알지 못합니다.

  1. z- 검정은 제곱이 아닙니다.

  2. 실제 테스트 통계는 완전히 다릅니다.

χ 2에 대한 검정 통계량χ2 의 값 은 다음과 같습니다.

χ2=i=1n(OiEi)2Ei=Ni=1npi(Oi/Npipi)2

= Pearson의 누적 검정 통계량으로, χ 2 분포에무조건 접근합니다. O i = 유형 i 의 관측치 수; N = 총 관측치 수; E i = N p i =모집단에서 유형 i 의 비율이 다음과 같은 귀무 가설에 의해 주장 된유형 i 의 예상 (이론적) 주파수χ2χ2OiiNEiNpiii; n = 테이블의 셀 수pin

반면에 검정에 대한 검정 통계량 은 다음과 같습니다.z

Z=x1n1x2n2p(1p)(1/n1+1/n2) , 여기서x1x2는 범주 형 변수 수준의 각 항목에있는 주제 수에 대한 "성공"수입니다. 즉,n1np=x1+x2n1+n2x1x2n1.n2

이 공식은 이항 분포에 의존하는 것 같습니다.

이 두 시험 통계는 분명히 다르며, 실제 시험의 통계뿐만 아니라 다른 결과를 초래할 P는 -values : 5.8481에 대한 과 는 z-시험 여기서 2.4183 2 = 5.84817 (감사합니다, @ mark999 ). χ 2 검정 의 p- 값 은 이고 z- 검정 의 경우 p- 값 은 입니다. 양측 꼬리와 단측 꼬리의 차이는 0.01559 / 2 = 0.007795입니다.χ22.41832.41832=5.84817χ20.015590.00770.01559/2=0.007795 (감사합니다 @amoeba).

그래서 우리는 어느 수준에서 그것들이 하나이고 같다고 말합니까?


그러나 이것들은 두 개의 동일한 테스트입니다. Z 제곱은 카이 제곱 통계량입니다. 열이 두 그룹이고 행이 "성공"및 "실패"인 2x2 빈도 테이블을 사용하십시오. 주어진 열에서 카이-제곱 검정의 소위 예상 주파수는 가중 (그룹의 N) 평균 열 (그룹) 프로파일 에 해당 그룹의 N을 곱한 값입니다. 따라서 카이-제곱의 편차를 테스트합니다. 이 평균 그룹 프로파일의 두 그룹 프로파일 각각-그룹의 프로파일 차이를 테스트하는 것과 동일한 비율의 z- 테스트.
ttnphns

마지막 하이퍼 링크의 예에서 는 z- 검정 통계량의 제곱이지만 거의 같지 않으며 p- 값이 다릅니다. 또한, 위의 나머지 통계에 대한 공식을 볼 때 그것들이 동일하다는 것이 즉각적입니까? 아니면 다른 하나의 사각형이라도? χ2
Antoni Parellada

2
에서가 chisq.test(), 당신이 사용하는 시도가 correct=FALSE?
mark999

1
실제로 안토니. 두 가지 테스트 모두 Yates가 있거나없는 상태로 존재합니다. 하나만 사용하고 다른 하나는 계산하지 않을 수 있습니까?
ttnphns

1
감사합니다! 당신은 (예상 적으로) 정확했습니다. 예이츠 보정을 끄면 하나는 다른 하나의 제곱입니다. 조금 빠르지 만 그에 따라 질문을 편집했습니다. 나는 여전히 두 가지 테스트 통계가 동일하다는 것을 대수적으로 증명하고 싶고 p- 값이 왜 다른지 이해하고 싶습니다.
Antoni Parellada

답변:


12

열이 두 개의 응답자 그룹이고 행이 두 개의 응답 "예"및 "아니오"인 2x2 빈도 테이블을 보자. 그리고 우리는 주파수를 그룹 내 비율 , 즉 수직 프로파일 로 전환했습니다 .

      Gr1   Gr2  Total
Yes   p1    p2     p
No    q1    q2     q
      --------------
     100%  100%   100%
      n1    n2     N

공식에서 빈도 대신 비율을 대체 한 표의 일반적인 (Yates 수정되지 않음) χ 2 는 다음과 같습니다.χ2

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2+n2(p2p)2pq.

기억 는 두 프로필의 가중 평균 프로파일의 소자와, 상기 화학식에 끼우 구하는p=n1p1+n2p2n1+n2(p1,q1)(p2,q2)

...=(p1p2)2(n12n2+n1n22)pqN2

바이 분자와 분모 분할 및 get ( P 1 - P 2 ) (2)(n12n2+n1n22)

(p1p2)2pq(1/n1+1/n2)=Z2,

"예"반응에 대한 비율의 z- 검정에 대한 z의 제곱 통계입니다.

따라서 2x2동질성 카이 제곱 통계량 (및 검정)은 두 비율의 z 검정에 해당합니다. 주어진 열에서 카이-제곱 검정에서 계산 된 소위 예상 주파수는 그룹에 의해 가중 된 n평균 수직 프로파일 (즉 "평균 그룹"의 프로파일)에 해당 그룹의 곱을 곱한 것입니다 n. 따라서 카이-제곱은이 평균 그룹 프로파일에서 두 그룹 프로파일 각각의 편차를 테스트합니다. 이는 그룹의 프로파일 차이를 서로 테스트하는 것과 같으며 이는 비율의 z 테스트입니다.

이것은 변수 연관 측정 (카이 제곱)과 그룹 차이 측정 (z- 검정 통계) 사이의 연결에 대한 하나의 데모입니다. 속성 연관과 그룹 차이는 종종 같은 것의 두 가지 측면입니다.


(@Antoni의 요청에 따라 위의 첫 번째 줄에 확장을 표시) :

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2qpq+n1(q1q)2ppq+n2(p2p)2qpq+n2(q2q)2ppq=n1(p1p)2(1p)+n1(1p11+p)2p+n2(p2p)2(1p)+n2(1p21+p)2ppq=n1(p1p)2(1p)+n1(pp1)2p+n2(p2p)2(1p)+n2(pp2)2ppq=[n1(p1p)2][(1p)+p]+[n2(p2p)2][(1p)+p]pq=n1(p1p)2+n2(p2p)2pq.


@ttnphs This is great! Any chance you could clarify the intermediate step in the first equation (χ2) formula - I don't see how the q's go away after the equal sign.
Antoni Parellada

@ttnphs 확장하면 n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(q(p2+p(2p12q1+p12)+p(q2+q12)pq)+n2(q(p2+p(2p22q2)+p22)+p(q2+q22)pq)
Antoni Parellada

@ttnphs ... Or some reference so it's less work to type the latex... And I'll promptly and happily 'accept' the answer...
Antoni Parellada

@Antoni, expansion inserted.
ttnphns

@ttnphns Awesome!
Antoni Parellada
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.