카이 제곱 검정과 동일한 비율의 검정 사이의 관계는 무엇입니까?


52

상호 배타적 인 특성을 가진 네 명의 인구가 있다고 가정합니다. 각 모집단에서 무작위 표본을 추출하여 측정중인 특성에 대한 크로스 탭 또는 빈도 표를 구성합니다. 내가 말하는 것이 맞습니까?

  1. 모집단과 특성간에 관계가 있는지 여부를 테스트하려면 (예 : 한 모집단이 특성 중 하나의 빈도가 높은지 여부) 카이 제곱 검정을 실행하고 결과가 유의한지 확인해야합니다.

  2. 카이 제곱 검정이 유의하면 모집단과 특성 사이에 어떤 관계가 있음을 보여 주지만 관계는 아닙니다.

  3. 또한 모든 특성이 모집단과 관련 될 필요는 없습니다. 예를 들어, 다른 모집단이 특성 A와 B의 분포가 크게 다르지만 C와 D의 분포가 다르면 카이 제곱 검정이 다시 중요하게 나타날 수 있습니다.

  4. 나는 특정 특성이 인구에 의해 영향을 받는지 여부를 측정하기 위해 원하는 경우에, 나는 같은 비율에 대한 테스트를 실행할 수 있습니다 (나는 이것이 Z 테스트라고, 또는 본 prop.test()에있는 R단지 특성에).

다시 말해, prop.test()카이 제곱 검정에서 유의 한 관계가 있다고 말할 때 두 범주의 관계 간의 특성을보다 정확하게 결정 하기 위해를 사용하는 것이 적절 합니까?


답변:


23

매우 짧은 답변 :

카이-제곱 검정 ( chisq.test()R 단위)은 우발성 표의 각 범주에서 관측 된 빈도를 예상 빈도 (마진 빈도의 곱으로 계산)와 비교합니다. 관측 카운트와 기대 카운트 사이의 편차가 너무 커서 우연에 의한 것인지 판단하는 데 사용됩니다. 잔차를 검사하여 독립으로부터의 출발을 쉽게 확인할 수 있습니다 ( ?mosaicplot또는을 시도 ?assocplot하지만 vcd패키지를보십시오). fisher.test()정확한 테스트에 사용하십시오 (초기 하 분포에 의존).

prop.test()R 의 함수를 사용하면 그룹간에 비율이 비슷한 지 또는 이론적 확률과 다른지 여부를 테스트 할 수 있습니다. 그것은이라 테스트 통계는 다음과 같다 때문에 -test :z

z=(f1f2)p^(1p^)(1n1+1n2)

여기서 이며 색인 은 표의 첫 번째와 두 번째 줄을 나타냅니다. 양방향 테이블에서 이면 일반적인 테스트 와 비슷한 결과를 얻을 수 있습니다 .p^=(p1+p2)/(n1+n2)(1,2)H0:p1=p2χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

R을 사용하여 이산 데이터를 분석 하려면 Laura Thompson 의 Agresti 's Categorical Data Analysis (2002) 와 함께 R (및 S-PLUS) 매뉴얼을 사용 하는 것이 좋습니다 .


2
prop.test ()가 수행하는 테스트의 공통 이름이 있습니까?
Atticus29

2
"z 테스트라고합니다."
russellpierce

내가 생각 - @chl 나는 조금 혼란 스러워요 prop.test그리고 chisq.test모두가이 게시물에 동일한 P 값을 설명 할 평방 카이,뿐만 아니라 이유를 사용 R-블로거 들이 자신의 특별 기능을 가지고있다.
Antoni Parellada 1

@Antoni 네, 이것이 Keith가 그의 답변에서 설명한 것입니다.
chl

3
뭐죠 및 , , , , ? n 2 f 1 f 2 p 1 p 2n1n2f1f2p1p2
tomka

23

두 비율의 동등성에 대한 카이 제곱 검정은 검정과 정확히 동일 합니다. 자유도가 1 인 카이 제곱 분포는 정규 편차의 제곱 분포입니다. 기본적으로 우연성 테이블의 하위 집합에서 카이 제곱 테스트를 반복합니다. (@chl이 두 테스트 모두 에서 정확히 동일한 값을 얻는 이유 입니다.)pzp

카이 제곱 테스트를 먼저 수행 한 다음 하위 집합에 대해 더 많은 테스트를 수행하기 위해 다이빙하는 문제는 반드시 알파를 보존 할 필요는 없다는 것입니다. 즉, 오 탐지를 5 % 미만으로 제어하지 않습니다 (또는 어떤 전체 실험에서).α

고전적인 패러다임에서이 작업을 올바르게 수행하려면 처음부터 가설을 식별하고 (비교할 비율) 데이터를 수집 한 다음 각 테스트 합계의 중요성에 대한 총 임계 값이되도록 가설을 테스트해야합니다. 하는 . 상관 관계가 있다는 선험 을 증명할 수 없다면α

비율의 동등성에 대한 가장 강력한 테스트를 Barnard의 우수성 테스트 라고 합니다 .


내가 생각 - @gung 나는 조금 혼란 스러워요 prop.test그리고 chisq.test모두가이 게시물에 동일한 P 값을 설명 할 평방 카이,뿐만 아니라 이유를 사용 R-블로거 들이 자신의 특별 기능을 가지고있다.
Antoni Parellada 1

@AntoniParellada, 당신을 혼란스럽게하는 것을 이해하지 못합니다. 이 대답은 "정확히 동일"하다는 것을 나타내며, "둘 다 카이-제곱을 사용하는 경우"에 의미가 있습니다.
gung-복원 Monica Monica

원래 답변에서 @gung은 chl에 따르면 prop.test()... 은와 대조적으로 z 테스트라고합니다 chisq.test(). 나중에 Keith는 "두 비율의 동등성에 대한 카이 제곱 검정은 z- 검정과 동일합니다. @chl이 두 검정에서 모두 동일한 p- 값을 얻는 이유입니다."
Antoni Parellada

1
@AntoniParellada, 그것은 단지 어리석은 표현 인 것 같습니다. 개념적으로, 두 가지 테스트는 서로 다른 것으로, 내가 본 다른 답변에서 논의한 내용입니다. 그러나 수학적으로는 동일합니다. prop.test()실제로 R 함수는 실제로 chisq.test()출력을 다르게 호출 하고 인쇄 한다고 생각합니다 .
gung-모니 티 복원

@ gung 나는 R-Bloggers와 비슷한 기능을 연구하고 있었고 초보자 수준의 사람들을 위해 게시물을 만들려고했습니다. square and z-test를 입력 한 다음 R 코드를 제공합니다
Antoni Parellada
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.