매우 짧은 답변 :
카이-제곱 검정 ( chisq.test()
R 단위)은 우발성 표의 각 범주에서 관측 된 빈도를 예상 빈도 (마진 빈도의 곱으로 계산)와 비교합니다. 관측 카운트와 기대 카운트 사이의 편차가 너무 커서 우연에 의한 것인지 판단하는 데 사용됩니다. 잔차를 검사하여 독립으로부터의 출발을 쉽게 확인할 수 있습니다 ( ?mosaicplot
또는을 시도 ?assocplot
하지만 vcd
패키지를보십시오). fisher.test()
정확한 테스트에 사용하십시오 (초기 하 분포에 의존).
prop.test()
R 의 함수를 사용하면 그룹간에 비율이 비슷한 지 또는 이론적 확률과 다른지 여부를 테스트 할 수 있습니다. 그것은이라 테스트 통계는 다음과 같다 때문에 -test :지
z=(f1−f2)p^(1−p^)(1n1+1n2)−−−−−−−−−−−−−−−−√
여기서 이며 색인 은 표의 첫 번째와 두 번째 줄을 나타냅니다. 양방향 테이블에서 이면 일반적인 테스트 와 비슷한 결과를 얻을 수 있습니다 .p^=(p1+p2)/(n1+n2)(1,2)H0:p1=p2χ2
> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)
Pearson's Chi-squared test with Yates' continuity correction
data: tab
X-squared = 0.8823, df = 1, p-value = 0.3476
> prop.test(tab)
2-sample test for equality of proportions with continuity correction
data: tab
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided
95 percent confidence interval:
-0.15834617 0.04723506
sample estimates:
prop 1 prop 2
0.8333333 0.8888889
R을 사용하여 이산 데이터를 분석 하려면 Laura Thompson 의 Agresti 's Categorical Data Analysis (2002) 와 함께 R (및 S-PLUS) 매뉴얼을 사용 하는 것이 좋습니다 .