다음 질문을 해결하려고합니다.
A 선수는 25 경기 중 17 승, B 선수는 20 명 중 8 승을 기록했습니다. 두 비율 사이에 큰 차이가 있습니까?
R에서해야 할 일은 다음과 같습니다.
> prop.test(c(17,8),c(25,20),correct=FALSE)
2-sample test for equality of proportions without continuity correction
data: c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
-0.002016956 0.562016956
sample estimates:
prop 1 prop 2
0.68 0.40
따라서이 테스트에서는 95 % 신뢰 수준에서 차이가 크지 않다고 말합니다.
우리는 그것이 prop.test()
근사만을 사용 한다는 것을 알고 있기 때문에 정확한 이항 검정을 사용하여 일을보다 정확하게 만들고 싶습니다. 두 가지 방법으로 수행합니다.
> binom.test(x=17,n=25,p=8/20)
Exact binomial test
data: 17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
0.4649993 0.8505046
sample estimates:
probability of success
0.68
> binom.test(x=8,n=20,p=17/25)
Exact binomial test
data: 8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
0.1911901 0.6394574
sample estimates:
probability of success
0.4
이제이게 이상하지 않습니까? p- 값은 매번 완전히 다릅니다! 두 경우 모두에서 결과는 (매우) 유의미하지만 p- 값은 다소 우연한 것으로 보입니다.
내 질문
- p- 값 이 매번 다른 이유는 무엇 입니까?
- R에서 정확히 두 개의 샘플 비율 이항 테스트를 올바르게 수행하는 방법은 무엇입니까?
prop.test
대chisq.test
)이 질문 에는 동일한 기본 개념이 있습니다. 세 가지 예에서 서로 다른 "널 가설"로 세 가지 테스트를 실행하고 있습니다.