짝을 이루지 않은 t- 검정에 어떤 정규성 가정이 필요합니까? 그리고 그들은 언제 만납니 까?


12

쌍을 이루는 t- 검정을 수행 하려면 일치하는 측정 단위 간의 평균 차이가 정상적으로 분포되어야합니다.

쌍을 이루는 t- 검정에서, 이는 일치하는 측정 단위 사이의 차이가 정상적으로 분포 될 것을 요구하면서 (AFAIK) 분명히 표현됩니다 (두 비교 그룹 각각의 분포가 정상이 아닌 경우에도).

그러나 쌍을 이루지 않은 t- 검정에서는 일치하는 단위 간의 차이에 대해 이야기 할 수 없으므로 두 그룹의 관측치가 정상이어야 평균의 차이가 정상입니다. 내 질문으로 연결됩니다.

평균의 차이가 정상적으로 분포되도록 두 개의 비정규 분포가 가능합니까? (따라서 내가 이해하는 한 다시 페어링되지 않은 t- 테스트를 수행하는 데 필요한 요구 사항을 충족시킵니다).

업데이트 : (답변에 모두 감사드립니다) 우리가 찾고있는 일반적인 규칙은 실제로 평균의 차이가 정상적이며 CLT로 인해 좋은 가정 (충분한 n 이하) 인 것으로 보입니다. 이것이 짝을 이루지 않은 t- 검정에 대해 작동하는 방법에 관해서는 나에게 놀랍습니다. 다음은 몇 가지 R 코드입니다.

n1 <- 10
n2 <- 10
mean1 <- 50
mean2 <- 50
R <- 10000

# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
# hist(diffs)

P <- numeric(R)
MEAN <- numeric(R)
for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    y2 <- runif(n2, 0, 2*mean2)
    MEAN[i] <- mean(y1) - mean(y2)
    P[i] <- t.test(y1,y2)$p.value
}
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
par(mfrow = c(1,2))
hist(P)
qqplot(P, runif(R)); abline(0,1)
sum(P<.05) / R # for n1=n2=10 -> 0.0715 # wrong type I error, but only for small n1 and n2 (for larger ones, this effect disappears)



n1 <- 100
mean1 <- 50
R <- 10000
P_y1 <- numeric(R)

for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}

par(mfrow = c(1,2))
hist(P_y1)
qqplot(P_y1, runif(R)); abline(0,1)
sum(P_y1<.05) / R # for n1=n2=10 -> 0.057  # "wrong" type I error

감사.


5
물론 입니다. 하자 당신의 IID 이변 샘플합니다. 하자 있는 임의의 분포 하고 취할 여기서 이다 IID . X i F Y i = X i + Z i { Z i } N ( 0 , σ 2 )(Xi,Yi)XiFYi=Xi+Zi{Zi}N(0,σ2)
추기경

답변:


17

실제로, 중앙 한계 정리 (Central Limit Theorem)는 광범위한 가정 하에서 테스트중인 두 표본 평균의 분포가 표본 크기가 커질 때 (이 가정이 나오는 곳) 표본 분포가 커짐에 따라 정규 분포에 근접하게된다는 것을 보장합니다. 기본 데이터의 분포 결과적으로 표본 크기가 커짐에 따라 평균의 차이가 정규 분포를 따르고 짝이없는 t- 검정의 t- 통계량이 공칭 t 분포를 갖기 위해 필요한 요구 사항이 충족됩니다. 따라서 통계적으로 실제 분포와 t 분포의 차이를 안전하게 무시하기 전에 표본 크기가 얼마나 커야 하는가?

많은 경우에, 특히 기초 분포가 대칭에 가까운 경우에 그 답은 "별로 크지 않습니다". 예를 들어, 각각 표본 크기가 10 인 두 개의 Uniform (0,1) 분포의 평균을 비교하여 100,000 번의 검정을 시뮬레이트했으며 95 % 신뢰 수준에서 검정 할 때 실제로는 시간의 5.19 %를 거의 거부하지 않았습니다. 우리가 기대하고있는 공칭 5 % 거부율 (5 % 이상 표준 편차는 약 2.7)입니다.

그렇기 때문에 사람들은 기본 가정이 실제로 충족되지 않지만 문제의 세부 사항에 따라 마일리지가 다를 수있는 모든 종류의 상황에서 t- 검정을 사용합니다. 그러나 Wilcoxon 테스트와 같이 정규성이 필요하지 않은 다른 테스트도 있습니다.이 테스트는 데이터가 정규 분포 일 때도 t- 검정보다 효율이 약 95 %입니다 (즉, 표본 크기가 필요함). N이 무한대로 진행됨에 따라 표본 크기가 N 인 t- 검정과 동일한 검정력을 갖도록 N / 0.95). 데이터가 정규 분포를 따르지 않으면 t- 검정보다 훨씬 나을 수 있습니다.


6
내 경험상 분포가 정확하기 위해 필요한 샘플 크기 는 종종 샘플 크기보다 큽니다. Wilcoxon 부호가있는 테스트는 말한 것처럼 매우 효율적이며 강력하기 때문에 거의 항상 테스트 보다 선호합니다 . ttt
Frank Harrell

고마워요 프랭크-당신의 의견은 내가 쫓아 온
Tal Galili

1

물론이야. 그렇지 않은 경우 독립 샘플 t- 검정은 많이 사용되지 않습니다. 두 개의 비정규 모집단 간의 평균 차이를 검정하기 위해서는 CLT에 호소해야하므로 표본 크기가 더 커야합니다.

간단한 예를 들어, 모집단 1은 평균 25의 지수에서 나오고 모집단 2는 평균 30으로 균일하게 분포되어 있다고 가정합니다. 샘플 함수의 차이 분포가 복제 함수를 사용하여 비교적 쉽게 R을 사용하는 것처럼 보이는지 확인할 수 있습니다.

n1 <- 30
n2 <- 25
mean1 <- 25
mean2 <- 30

diffs <- replicate(10000, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
hist(diffs)

표본 크기를 가지고 놀면 표본 크기가 낮을 때 실제로 정규성이 없지만 표본 크기를 늘리면 평균의 차이에 대해보다 정상적인 표본 추출 분포를 얻을 수 있습니다. 물론이 예제에서 사용 된 분포를 변경하여 추가로 탐색 할 수 있습니다. hist (diffs)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.