비교하려는 두 그룹 (예 : 샘플)에 대한 데이터가 있지만 총 샘플 크기는 작고 (n = 29) 불균형 (n = 22 대 n = 7)입니다.
이러한 데이터는 논리적으로 수집하기가 어렵고 비용이 많이 들기 때문에 확실한 솔루션 인 '더 많은 데이터 수집'은 도움이되지 않습니다.
여러 가지 변수 (출발일, 도착 일, 이동 기간 등)가 측정되었으므로 여러 테스트가 있으며, 그 중 일부는 매우 다릅니다 (분산이 큰 샘플 일수록).
처음에는 동료가이 데이터에 대해 t- 검정을 실행했으며 일부는 P <0.001에서 통계적으로 유의미했으며 일부는 P = 0.069에서 유의미하지 않았습니다. 일부 샘플은 정규 분포가되었지만 다른 샘플은 분산되지 않았습니다. 일부 테스트에는 '동일한'분산에서 크게 벗어난 것이 포함되었습니다.
몇 가지 질문이 있습니다.
- 여기서 t- 검정이 적절합니까? 그렇지 않다면 왜? 정규성 및 분산 평등의 가정이 충족되는 검정에만 적용됩니까?
- 적합한 대안은 무엇입니까? 아마도 순열 테스트입니까?
- 동일하지 않은 분산은 제 1 종 오류를 부풀립니다. 그러나 어떻게? 작은 불균형 표본 크기가 제 1 종 오류에 어떤 영향을 미칩니 까?