나는 이항 분포를 갖는 세 개의 데이터 그룹을 가지고 있습니다 (즉, 각 그룹에는 성공 또는 실패 요소가 있습니다). 예상되는 성공 확률은 없지만 대신 실제 성공률에 대한 근사값으로 각각의 성공률에만 의존 할 수 있습니다. 이 질문 만 찾았 습니다. 가까이 있지만이 시나리오를 정확하게 다루지 않는 것 같습니다.
테스트를 단순화하기 위해 2 개의 그룹 (이 기본 사례에서 3 개를 확장 할 수 있음)이 있다고 가정 해 보겠습니다.
- 그룹 1 시험 : = 2455
- 그룹 2 시험 : = 2730
- 그룹 1 성공 : = 1556
- 그룹 2 성공 : = 1671
나는 예상되는 성공 확률이 없으며 샘플에서 아는 것만 있습니다. 따라서 두 그룹의 내 암시 적 성공률은 다음과 같습니다.
- 그룹 1 성공률 : = 1556/2455 = 63.4 %
- 그룹 2 성공률 : = 1671/2730 = 61.2 %
각 샘플의 성공률은 상당히 비슷합니다. 그러나 내 샘플 크기도 상당히 큽니다. 이항 분포의 CDF를 검사하여 첫 번째와 다른 점을 확인하면 (첫 번째는 널 테스트라고 가정) 두 번째는 달성 될 가능성이 매우 적습니다.
Excel에서 :
1-BINOM.DIST (1556,2455,61.2 %, 참) = 0.012
그러나 이것은 첫 번째 결과의 분산을 고려하지 않고 첫 번째 결과가 검정 확률이라고 가정합니다.
이 두 샘플 데이터가 실제로 통계적으로 다른지 테스트하는 더 좋은 방법이 있습니까?
prop.test
: prop.test(c(1556, 1671), c(2455, 2730))
.