다음 상황을 가정하십시오.
우리는 작은 그룹 크기 (예 : n = 3)로 많은 수 (예 : 20)를 가지고 있습니다. 균일 분포에서 값을 생성하면 오차 분포가 균일하더라도 잔차가 거의 정상적으로 보입니다. 다음 R 코드는이 동작을 보여줍니다.
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
세 그룹의 샘플 잔차를 보면 동작의 이유가 분명합니다.
은 표준 편차가 거의 다르지 않은 임의의 변수의 합 이므로 분포는 개별 항보다 정규 분포에 상당히 가깝습니다.
이제 시뮬레이션 된 데이터 대신 실제 데이터와 동일한 상황이 있다고 가정하십시오. 정규성에 대한 분산 분석 가정이 적용되는지 평가하고 싶습니다. 가장 권장되는 절차는 잔차 (예 : QQ-Plot)의 육안 검사 또는 잔차에 대한 정규성 테스트를 권장합니다. 위의 예와 같이 소규모 그룹에는 적합하지 않습니다.
소규모 그룹이 많은 경우 더 나은 대안이 있습니까?