t- 검정을 사용하여 평균에 차이가 있는지 평가할 수 있습니다. 다른 표본 크기는 t- 검정에 문제를 일으키지 않으며 결과를 특별한주의를 기울여 해석 할 필요가 없습니다. 궁극적으로 단일 분포를 알려진 분포와 평균 및 SD를 가진 무한한 모집단과 비교할 수도 있습니다. 예를 들어 IQ가 130 인 사람은 97.7 %보다 똑똑합니다. 그러나 한 가지 주목할 점은 주어진 (즉, 총 샘플 크기)에 대해 그룹 이 같으면 검정력이 최대화된다는 것입니다 . 그룹 크기가 매우 다르면 각각의 추가 관측으로 추가 해상도를 얻지 못합니다. nNn
권력에 대한 요점을 명확히하기 위해 R에 대해 작성된 매우 간단한 시뮬레이션이 있습니다.
set.seed(9) # this makes the simulation exactly reproducible
power5050 = vector(length=10000) # these will store the p-values from each
power7525 = vector(length=10000) # simulated test to keep track of how many
power9010 = vector(length=10000) # are 'significant'
for(i in 1:10000){ # I run the following procedure 10k times
n1a = rnorm(50, mean=0, sd=1) # I'm drawing 2 samples of size 50 from 2 normal
n2a = rnorm(50, mean=.5, sd=1) # distributions w/ dif means, but equal SDs
n1b = rnorm(75, mean=0, sd=1) # this version has group sizes of 75 & 25
n2b = rnorm(25, mean=.5, sd=1)
n1c = rnorm(90, mean=0, sd=1) # this one has 90 & 10
n2c = rnorm(10, mean=.5, sd=1)
power5050[i] = t.test(n1a, n2a, var.equal=T)$p.value # here t-tests are run &
power7525[i] = t.test(n1b, n2b, var.equal=T)$p.value # the p-values are stored
power9010[i] = t.test(n1c, n2c, var.equal=T)$p.value # for each version
}
mean(power5050<.05) # this code counts how many of the p-values for
[1] 0.7019 # each of the versions are less than .05 &
mean(power7525<.05) # divides the number by 10k to compute the %
[1] 0.5648 # of times the results were 'significant'. That
mean(power9010<.05) # gives an estimate of the power
[1] 0.3261
모든 경우 이지만 첫 번째 경우 & 이고 두 번째 경우 & 이고 마지막 경우 및 입니다. 또한 표준화 된 평균 차이 / 데이터 생성 프로세스는 모든 경우에 동일하다는 점에 유의하십시오. 그러나 테스트는 50-50 샘플에 대해 70 %의 시간 동안 '중요한'것으로 나타 났지만 그룹 크기가 90-10 일 때 전력은 75-25에서 56 %, 33 %에 불과했습니다. n 1 = 50 n 2 = 50 n 1 = 75 n 2 = 25 n 1 = 90 n 2 = 10N=100n1=50n2=50n1=75n2=25n1=90n2=10
나는 이것을 유추하여 생각합니다. 당신이 사각형의 영역을 알고 싶어하고, 경계가 고정되어있는 경우 길이와 너비가 동일한 경우 (즉, 사각형이 경우, 다음 영역이 극대화됩니다 광장 ). 반면에, 직사각형이 길어짐에 따라 길이와 너비가 달라짐에 따라 면적이 줄어 듭니다.