분석
이것은 개념적인 질문이므로 간단히하기 위해 신뢰 구간 [ ˉ x ( 1 ) + Z α / 2 s ( 1 ) / √ 의 상황을 고려해 봅시다.1−α은크기n의 랜덤 샘플x(1)를사용하여평균μ에대해 구성되고, 제 2 랜덤 샘플x(2)는모두 동일한 법선(μ,σ2)분포로부터크기m의 크기로 취해진 다. (원하는 경우n-1자유도의학생t분포값으로Zs를대체 할 수있습니다. 다음 분석은 변경되지 않습니다.)
[x¯(1)+Zα/2s(1)/n−−√,x¯(1)+Z1−α/2s(1)/n−−√]
μx(1)nx(2)m(μ,σ2)Ztn−1
두 번째 표본의 평균이 첫 번째 표본에 의해 결정된 CI 내에있을 확률은
Pr(x¯(1)+Zα/2n−−√s(1)≤x¯(2)≤x¯(1)+Z1−α/2n−−√s(1))=Pr(Zα/2n−−√s(1)≤x¯(2)−x¯(1)≤Z1−α/2n−−√s(1)).
첫 번째 표본 평균 은 첫 번째 표본 표준 편차 (정규 필요)와 독립적이므로 두 번째 표본은 첫 번째 표본과 독립적이므로 표본의 차이는 의미합니다. 은 과 독립적입니다 . 또한이 대칭 구간에 대해 입니다. 따라서 랜덤 변수 대해 를 작성 하고 두 부등식을 제곱하면 문제의 확률은 다음과 같습니다.x¯(1)s(1)U=x¯(2)−x¯(1)s(1)Zα/2=−Z1−α/2Ss(1)
Pr(U2≤(Z1−α/2n−−√)2S2)=Pr(U2S2≤(Z1−α/2n−−√)2).
기대 법칙은 의 평균이 이고 분산이U0
Var(U)=Var(x¯(2)−x¯(1))=σ2(1m+1n).
는 정규 변수의 선형 조합 이므로 정규 분포도 있습니다. 따라서 는 곱하기 변수입니다. 우리는 이미 가 곱하기 변수 라는 것을 알고있었습니다 . 결과적으로 는 분포 의 변수에 곱하기 입니다. 필요한 확률은 F 분포에 의해UU2σ2(1n+1m)χ2(1)S2σ2/nχ2(n−1)U2/S21/n+1/mF(1,n−1)
F1,n−1(Z21−α/21+n/m).(1)
토론
흥미로운 것은 두 번째 표본이 첫 번째 표본과 동일한 크기이므로 이고 과 만이 확률을 결정합니다. 에 대해 에 대해 플롯 된 값은 다음과 같습니다 .n/m=1nα(1)αn=2,5,20,50
증가함에 따라 그래프는 각각의 에서 한계 값 으로 상승합니다. 일반적인 테스트 크기 는 세로 회색 선으로 표시됩니다. 지연 값 경우 의 제한 확률 은 약 입니다.αnα=0.05n=mα=0.0585%
이 한계를 이해함으로써 우리는 작은 표본 크기의 세부 사항을 살펴보고 문제의 요점을 더 잘 이해할 것입니다. 마찬가지로 커질 상기 분포는 접근 분포. 표준 정규 분포 와 관련하여 확률 은 근사치입니다.n=mFχ2(1)Φ(1)
Φ(Z1−α/22–√)−Φ(Zα/22–√)=1−2Φ(Zα/22–√).
예를 들어, 경우 및 입니다. 결과적으로 곡선에 의해 달성 제한값 로서 증가가있을 것이다 . 에 거의 도달했음을 알 수 있습니다 (여기서 입니다).α=0.05Zα/2/2–√≈−1.96/1.41≈−1.386Φ(−1.386)≈0.083α=0.05n1−2(0.083)=1−0.166=0.834n=500.8383…
작은 경우 와 보완 확률 (CI가 두 번째 평균을 포함 하지 않을 위험) 사이의 관계 는 거의 완벽하게 거듭 제곱 법칙입니다. αα 이것을 표현하는 또 다른 방법은 로그 보완 확률이 거의 의 선형 함수라는 것입니다 . 제한 관계는 대략logα
log(2Φ(Zα/22–√))≈−1.79712+0.557203log(20α)+0.00657704(log(20α))2+⋯
다시 말하면, 큰 및 의 전통적인 값인 근처의 경우 은n=mα0.05(1)
1−0.166(20α)0.557.
(이것은 내가 /stats//a/18259/919에 게시 한 겹치는 신뢰 구간에 대한 분석을 매우 많이 상기시켜줍니다 . 실제로, 의 마법의 힘은 마법의 힘의 거의 역수입니다. 여기에, .이 시점에서 실험의 재현성 측면에서 그 분석을 다시 해석 할 수 있어야합니다.)1.910.557
실험 결과
이 결과는 간단한 시뮬레이션으로 확인됩니다. 다음 R
코드는 적용 빈도, 으로 계산 된 기회 및 Z- 점수가 얼마나 다른지를 평가합니다. Z- 점수는 일반적으로 (또는 또는 CI의 계산 여부)에 관계없이 크기 가 보다 작으며 공식 의 정확성을 나타냅니다 .2 n , m , μ , σ , α Z t ( 1 )(1)2n,m,μ,σ,αZt(1)
n <- 3 # First sample size
m <- 2 # Second sample size
sigma <- 2
mu <- -4
alpha <- 0.05
n.sim <- 1e4
#
# Compute the multiplier.
#
Z <- qnorm(alpha/2)
#Z <- qt(alpha/2, df=n-1) # Use this for a Student t C.I. instead.
#
# Draw the first sample and compute the CI as [l.1, u.1].
#
x.1 <- matrix(rnorm(n*n.sim, mu, sigma), nrow=n)
x.1.bar <- colMeans(x.1)
s.1 <- apply(x.1, 2, sd)
l.1 <- x.1.bar + Z * s.1 / sqrt(n)
u.1 <- x.1.bar - Z * s.1 / sqrt(n)
#
# Draw the second sample and compute the mean as x.2.
#
x.2 <- colMeans(matrix(rnorm(m*n.sim, mu, sigma), nrow=m))
#
# Compare the second sample means to the CIs.
#
covers <- l.1 <= x.2 & x.2 <= u.1
#
# Compute the theoretical chance and compare it to the simulated frequency.
#
f <- pf(Z^2 / ((n * (1/n + 1/m))), 1, n-1)
m.covers <- mean(covers)
(c(Simulated=m.covers, Theoretical=f, Z=(m.covers - f)/sd(covers) * sqrt(length(covers))))