계산한다고 주장하는 Excel 시트를보고 있지만이 방법을 인식하지 못하고 뭔가 빠졌는지 궁금합니다.
분석하는 데이터는 다음과 같습니다.
+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
| 2000 | 42 | 32.5 |
| 2000 | 42 | 32.5 |
| 2000 | 25 | 32.5 |
| 2000 | 21 | 32.5 |
+------------------+----------+----------+
카이 제곱을 계산하기 위해 각 그룹에서 수행하는 합계는 다음과 같습니다.
P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B
따라서 각 그룹의 는 다음과 같습니다.
2.822793
2.822793
1.759359
4.136448
그리고 총 Chi Square는 다음과 같습니다 11.54139
.
그러나 를 계산하는 모든 예제 는 이와 완전히 다릅니다. 나는 각 그룹에 대해 할 것입니다 :
chiSq = (Observed-Expected)^2 / Expected
따라서 위의 예에서 총 카이 제곱 값은 11.3538
입니다.
내 질문은-왜 엑셀 시트 에서 이런 식으로 를 계산 합니까? 이것이 인정 된 접근법입니까?
최신 정보
이것을 알고 싶어하는 이유는 이러한 결과를 R 언어로 복제하려고하기 때문입니다. chisq.test 함수를 사용하고 있는데 Excel 시트와 같은 숫자가 나오지 않습니다. 따라서 누군가 R 에서이 접근법을 수행하는 방법을 알고 있다면 매우 도움이 될 것입니다!
업데이트 2
관심있는 사람이 있다면 R로 계산 한 방법입니다.
res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)
x=c(42,42,25,21);chisq.test(cbind(x,2000-x))