두 그룹의 소규모 및 불균형 표본 크기-수행 할 작업

비교하려는 두 그룹 (예 : 샘플)에 대한 데이터가 있지만 총 샘플 크기는 작고 (n = 29) 불균형 (n = 22 대 n = 7)입니다.

이러한 데이터는 논리적으로 수집하기가 어렵고 비용이 많이 들기 때문에 확실한 솔루션 인 '더 많은 데이터 수집'은 도움이되지 않습니다.

여러 가지 변수 (출발일, 도착 일, 이동 기간 등)가 측정되었으므로 여러 테스트가 있으며, 그 중 일부는 매우 다릅니다 (분산이 큰 샘플 일수록).

처음에는 동료가이 데이터에 대해 t- 검정을 실행했으며 일부는 P <0.001에서 통계적으로 유의미했으며 일부는 P = 0.069에서 유의미하지 않았습니다. 일부 샘플은 정규 분포가되었지만 다른 샘플은 분산되지 않았습니다. 일부 테스트에는 '동일한'분산에서 크게 벗어난 것이 포함되었습니다.

몇 가지 질문이 있습니다.

여기서 t- 검정이 적절합니까? 그렇지 않다면 왜? 정규성 및 분산 평등의 가정이 충족되는 검정에만 적용됩니까?
적합한 대안은 무엇입니까? 아마도 순열 테스트입니까?
동일하지 않은 분산은 제 1 종 오류를 부풀립니다. 그러나 어떻게? 작은 불균형 표본 크기가 제 1 종 오류에 어떤 영향을 미칩니 까?

t-test sample-size

— DeanP
소스

답변:

두 모집단의 분산이 서로 다른 경우 두 모집단의 동일한 분산을 가정하는 T- 검정은 유효하지 않으며, 표본 크기가 다르면 더 나쁩니다. 가장 작은 표본 크기가 분산이 가장 큰 표본 인 경우 테스트에서 유형 I 오류가 부풀려집니다. 반면에 Welch-Satterthwaite 버전의 t- 검정은 동일한 분산을 가정하지 않습니다. Fisher-Pitman 순열 테스트에 대해 생각할 경우 동일한 분산을 가정합니다 (낮은 p- 값에서 다른 평균을 추론하려는 경우).

당신이 생각하고 싶은 다른 것들이 많이 있습니다 :

(1) 분산이 명확하게 다른 경우 평균 간의 차이에 여전히 관심이 있습니까?

(2) p- 값보다 효과 추정값이 더 유용 할 수 있습니까?

(3) 일련의 일 변량 비교를하는 것이 아니라 데이터의 다변량 특성을 고려하고 싶습니까?

— Scortchi-복권 모니카
소스

안녕하세요 Scortchi, 답변 주셔서 감사합니다. 나는 당신이 제기 한 질문들을 고려했습니다 :

— DeanP

(1) 분산과 평균 모두 우리 연구에 유익 할 수 있습니다 (예 : 이주 출발 날짜는 한 인구에 대해 상당히 늦을 수 있으며 출발 날짜 범위는 더 다양합니다).

— DeanP

(1) 사람들은 종종 불균형 한 차이를 기술적 인 문제로만 생각하고 그 자체로 흥미로운 사실을 잊어 버리기 때문에 언급했습니다.

— Scortchi-Monica Monica 복원

(2) 필자의 요점은 p- 값 목록이 일반적으로 신뢰 구간이있는 효과 크기 추정 목록 (평균, 평균, 분산 또는 기타) 목록보다 유용하지 않다는 것입니다. 특히 작은 표본의 경우 신뢰 구간은 p- 값이 높더라도 실질적으로 중요한 효과 크기가 여전히 데이터와 일치하는지 여부를 보여줄 수 있습니다.

— Scortchi-Monica Monica 복원

(3) 하나의 독립 변수 (그룹)와 여러 종속 변수 (마이그레이션 시간 & c.)를 생각했습니다. 그룹 간의 흥미로운 차이점은 종속 변수 간의 관계 변화 일 수 있습니다. 첫 번째 단계는 대각선을 따라 그룹 사이의 각 dv를 비교하는 상자 그림 또는 점 그림과 다른 셀의 dvs (차별 그룹)의 각 쌍에 대한 산점도를 가진 멋진 행렬입니다. 솔직히 말하면, 표본 크기가 작은 탐색 적 분석을 위해서는 이것이 마지막 단계 일 수 있습니다.

— Scortchi-Monica Monica 복원

첫째, Scortchi가 이미 지적했듯이 T- 검정은 데이터 분포에 대한 가정 때문에 데이터에 적합하지 않습니다.

두 번째로, 나는 T- 테스트에 대한 대안을 제안 할 것입니다. 관심사가 사실에 관한 것이라면, 두 표본의 분포가 같거나 같지 않은 경우 양면 버전의 Wilcoxon 순위 합계 검정을 사용하려고 시도 할 수도 있습니다. Wilcoxon 순위 합계 테스트는 비모수 테스트입니다. 이러한 종류의 테스트는 데이터의 기본 분포에 대해 잘 모르는 경우 특히 유용합니다.

작은 표본 크기와 큰 집단에 대한 정확한 테스트 솔루션 이 있습니다 . 또한 Wilcoxon 순위 합계 테스트를 실현 하는 R 패키지 도 있습니다 .

매개 변수가없는 테스트이며 작은 샘플 크기도 처리하므로 테스트 사례에 적합해야합니다.

— 알렉스 VII
소스