쌍을 이루는 t- 검정을 수행 하려면 일치하는 측정 단위 간의 평균 차이가 정상적으로 분포되어야합니다.
쌍을 이루는 t- 검정에서, 이는 일치하는 측정 단위 사이의 차이가 정상적으로 분포 될 것을 요구하면서 (AFAIK) 분명히 표현됩니다 (두 비교 그룹 각각의 분포가 정상이 아닌 경우에도).
그러나 쌍을 이루지 않은 t- 검정에서는 일치하는 단위 간의 차이에 대해 이야기 할 수 없으므로 두 그룹의 관측치가 정상이어야 평균의 차이가 정상입니다. 내 질문으로 연결됩니다.
평균의 차이가 정상적으로 분포되도록 두 개의 비정규 분포가 가능합니까? (따라서 내가 이해하는 한 다시 페어링되지 않은 t- 테스트를 수행하는 데 필요한 요구 사항을 충족시킵니다).
업데이트 : (답변에 모두 감사드립니다) 우리가 찾고있는 일반적인 규칙은 실제로 평균의 차이가 정상적이며 CLT로 인해 좋은 가정 (충분한 n 이하) 인 것으로 보입니다. 이것이 짝을 이루지 않은 t- 검정에 대해 작동하는 방법에 관해서는 나에게 놀랍습니다. 다음은 몇 가지 R 코드입니다.
n1 <- 10
n2 <- 10
mean1 <- 50
mean2 <- 50
R <- 10000
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
# hist(diffs)
P <- numeric(R)
MEAN <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
y2 <- runif(n2, 0, 2*mean2)
MEAN[i] <- mean(y1) - mean(y2)
P[i] <- t.test(y1,y2)$p.value
}
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
par(mfrow = c(1,2))
hist(P)
qqplot(P, runif(R)); abline(0,1)
sum(P<.05) / R # for n1=n2=10 -> 0.0715 # wrong type I error, but only for small n1 and n2 (for larger ones, this effect disappears)
n1 <- 100
mean1 <- 50
R <- 10000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
par(mfrow = c(1,2))
hist(P_y1)
qqplot(P_y1, runif(R)); abline(0,1)
sum(P_y1<.05) / R # for n1=n2=10 -> 0.057 # "wrong" type I error
감사.