2 x 2를 초과하는 테이블에 대한 독립성을위한 카이 제곱 테스트의 대안


9

클래스를 병합하지 않으려는 경우 2 x 2보다 큰 테이블과 5보다 작은 셀을 가진 범주 형 변수에 대한 카이 제곱 검정의 대안은 무엇입니까?


2
카이-제곱 검정은 2x2보다 큰 테이블에서도 사용할 수 있습니다. 카이-제곱 검정이 문제에 적합하지 않은 이유를 설명해 주시겠습니까? 또한 해결하고자하는 문제를 설명 할 수 있습니까?
COOLSerdash

나는 2 x 3 비상 테이블을 가지고 있으며, 5보다 작은 셀 수
이스라엘

2
감사합니다. 질문을 수정하고 모든 사람이 댓글을 읽지는 않으므로이 정보를 추가하십시오. 카이-제곱 검정에 대한 일반적인 경험 법칙은 예상 셀 수가 5보다 작 으면 결과가 정확하지 않을 수 있다는 것입니다. 일반적으로 이러한 경우 Fisher-Test 가 권장됩니다. 버나드의 시험 은 옵션 일 수도 있습니다.
COOLSerdash

답변:


15

여기에 몇 가지 일반적인 오해가 있습니다. 카이 제곱 테스트는 다음보다 큰 테이블에서 사용하기에 완벽합니다.2×2. 카이 제곱 검정 통계량의 실제 분포가 카이 제곱 분포에 근사하도록하기 위해 전통적인 권장 사항은 모든 셀에 예상 값 이 있다는 것입니다.5. 여기에 두 가지 사항에 유의해야합니다.

  1. 관찰 된 세포 계수가 무엇인지는 중요하지 않습니다. 0문제없이 — 예상 횟수 만 중요합니다.

  2. 이 전통적인 경험 법칙은 이제 너무 보수적 인 것으로 알려져 있습니다. 갖는 것이 좋을 수 있습니다20% 카운트가 예상되는 셀 수 <5 예상 카운트가없는 한 <1. 보다:

예상 개수가 이보다 정확한 기준과 일치하지 않으면 몇 가지 대체 옵션을 사용할 수 있습니다.

  1. 가장 좋은 방법은 테스트 통계의 샘플링 분포를 시뮬레이션하거나 순열 테스트를 사용하는 것입니다. 예를 들어 R에서는 간단히 설정할 수 있습니다 chisq.test(..., simulate.p.value=TRUE). 다른 소프트웨어도이를 가능하게해야합니다.

  2. Fisher의 정확한 테스트와 같은 대체 테스트를 사용할 수 있습니다. Fisher의 정확한 테스트는이 상황에서 종종 권장되지만, 다른 가정을하고 적절하지 않을 수도 있습니다. 즉, Fisher의 정확한 테스트는 행과 열 수를 미리 설정 한 것으로 가정하고 행 x 열 조합의 배열 만 다를 수 있습니다 (참고 : 요즘 컴퓨터의 성능을 고려할 때 카이 제곱 테스트를 수행 할 이유가 있습니까? Fisher의 정확한 테스트보다는? ). 이 가정이 불편한 경우 카이 제곱을 시뮬레이션하는 것이 더 좋습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.