McNemar의 검정에서 정규 분포가 아닌 카이 제곱을 사용하는 이유는 무엇입니까?


11

나는 정확하지 않은 McNemar의 테스트가 카이 제곱 점근 분포를 어떻게 사용하는지 알아 냈습니다. 그러나 (두 경우 표에 대한) 정확한 검정은 이항 분포에 의존하기 때문에 이항 분포에 대한 정규 근사를 제안하는 것이 일반적이지 않은 이유는 무엇입니까?

감사.

답변:


15

직관적 인 답변 :

표에 주어진 McNemar 검정의 공식을 자세히 살펴보십시오.

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

McNemar 통계량 M은 다음과 같이 계산됩니다.

미디엄=()2+

k 자유도 를 갖는 분포 의 정의는 k 독립 표준 정규 변수 의 제곱 의 합으로 구성된다는 것 입니다. 4 개 수치는 충분히 큰 경우 와 이에하고 및 정규 분포로 근사 할 수있다. M에 대한 공식이 주어지면 충분히 큰 값을 가질 때 실제로 1 자유도를 갖는 대략 분포를 따른다는 것을 쉽게 알 수 있습니다 .χ 2χ2bcb-cb+cMχ2


편집 : onstop이 올바르게 지적한 바와 같이, 정상적인 근사값은 실제로 완전히 동일합니다. b-c정규 분포 에 의한 근사를 사용하는 주장을 고려하면 다소 사소합니다 .

이항 정확한 버전이 버전 이항 분포를 비교하기 위해 사용된다는 점에서 또한 기호 시험에 상당 b로 . 또는 귀무 가설 하에서 b의 분포는 의해 근사 될 수 있다고 말할 수 있습니다 .N ( 0.5 x ( b + c ) , 0.5 2 x ( b + c )나는영형미디엄(+,0.5)(0.5×(+),0.52×(+)

또는 동등하게 :

(+2)+2(0,1)

어떤 단순화

+(0,1)

또는 양쪽의 정사각형을 찍을 때 .미디엄χ12

따라서 정규 근사 사용됩니다. 근사 와 동일합니다 .χ2


3
맞습니다. Sqrt (M) = (bc) / Sqrt (b + c)를 고려하면 연결을보다 명확하게 볼 수 있습니다. b의 b 분산을 b로, c의 c 분산을 c로 분산하면 (계산 된 데이터에서 일반적으로 사용됨) Sqrt (M)은 표준 편차로 나눈 대략 정규 변동 (bc)처럼 보입니다. 표준 정규 변량 처럼 보입니다 . 실제로 Sqrt (M)을 표준 정규 분포 표를 참조하여 동등한 테스트를 수행 할 수 있습니다. 이를 제곱하면 테스트 대칭이 양측이됩니다. b 또는 c가 작은 경우 분명히 고장납니다.
whuber

직관적 인 답변 Joris에 감사드립니다. 그럼에도 불구하고 왜이 근사법을 사용하는 것보다 McNemar의 정확한 이항 검정에 대한 정규 근사법을 사용하는 것이 더 일반적입니까?
탈 Galili

@ 탈 : 동일합니다. 논스톱 답변 및 내 편집 내용을 참조하십시오.
Joris Meys

실제로-마지막 질문입니다. 따라서 둘 다 동일하고 (bc 주위에 "절대적인 값"이 필요할 수도 있다고 생각한다면) 사람들이 왜 평범한 값을 유지하는 대신 chi 분포로 이동합니까? 장점은 어디에 있습니까?
탈 Galili

1
@Tal : 당신은 R이 chi2를 1 자유 도로 플롯하는 것을 알고 있습니다.
Joris Meys

8

두 가지 접근 방식이 똑같지 않습니까? 관련 카이-제곱 분포는 1 자유도를 가지므로 표준 정규 분포를 사용하여 임의 변수의 제곱 분포를 간단히 나타낼 수 있습니다. 나는 대수를 통해 확인해야합니다. 지금 할 시간이 없었지만 두 가지 방법으로 똑같은 대답으로 끝나지 않으면 놀랄 것입니다.


자세한 설명은 내 답변을 참조하십시오
Joris Meys

안녕 원 스톱-둘 다 점근선이므로 작은 N의 경우 다소 다른 결과를 낼 수 있습니다. 이 경우 카이-제곱으로가는 선택이 일반적인 근사치보다 낫거나 역사적인 이유 때문에 (또는 여러분이 제안한대로 항상 동일한 결과를
냅니다

@Tal : 더 작은 N의 경우 둘 다 유지되지 않습니다. 그리고 내 편집에서 볼 수 있듯이 정확히 동일합니다.
Joris Meys
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.