표준 편차는 다른 어느 곳에서나 적용 할 수 있습니다 . 데이터 분산에 대한 유용한 정보를 제공합니다. 특히, sd를 표본 크기의 제곱근으로 나눈 값은 하나의 표준 오차입니다. 평균의 샘플링 분포의 분산을 추정합니다. 계산하자 :
3.2 % / 10000−−−−−√= 0.032 % = 0.00032
그건 작은 댄 --far 작은 당신이 찾는 정밀.± 0.50 %
데이터는 정규 분포가 아니지만 표본 크기가 너무 커서 표본 평균이 정규 분포에 매우 가깝습니다. 예를 들어, 여기에는 귀하와 동일한 특성을 가진 샘플의 히스토그램이 있으며 오른쪽에는 동일한 모집단의 추가 샘플 수천 개에 대한 히스토그램이 있습니다.
보통과 매우 비슷해 보이지 않습니까?
따라서 올바르게 부트 스트랩하는 것처럼 보이지만 부트 스트랩은 필요하지 않습니다. 평소와 같이 표준 오차에 표준 정규 분포의 적절한 백분위 수를 곱하여 평균에 대한 대칭 신뢰 구간을 얻습니다. wit, ) 및 해당 거리를 평균의 양쪽으로 이동합니다. 귀하의 경우 이므로 신뢰 구간은100 - α %지1 − α / 200지1 − α / 200= 2.575899 %
( 0.977 - 2.5758 ( 0.032 ) / 10000−−−−−√, 0.977 + 2.5758 ( 0.032 ) / 10000 −−−−−√)= ( 97.62 % , 97.78 % ) .
이 관계를 반전시켜 샘플 크기를 풀면 충분한 샘플 크기 를 찾을 수 있습니다. 여기에서 샘플 크기가 필요하다는 것을 알려줍니다.
( 3.2 % / ( 0.5 % / Z1 − α / 200) )272 272.
이것은 평균의 샘플링 분포가 보통이라는 결론을 다시 확인하기에 충분히 작습니다 . 나는 인구에서 샘플을 채취 하여 평균을 반복했습니다.99992729999
물론 정상으로 보입니다. 실제로 부트 스트랩 신뢰 구간 은 정규 이론 CI 거의 동일합니다 .( 97.19 % , 98.24 % )( 97.16 % , 98.21 % )( 97.19 % , 98.24 % )
이들 실시 예는 표시로서 절대 샘플 크기는 추정의 정확도보다 인구 크기의 비율을 결정한다. (극단이지만 직관적 인 예는 한 방울의 바닷물이 바다의 소금 농도를 정확하게 추정 할 수 있다는 것입니다. 비록 그 방울이 모든 바닷물의 아주 작은 부분 일지라도 말입니다. 의 (이상 필요 의 샘플 많은 작품으로 번 과잉이다).36 2721000036272
R
이러한 분석을 수행하고 그래픽을 플롯하는 코드는 다음과 같습니다. 평균 , SD 의 베타 분포를 갖는 모집단에서 표본을 추출합니다 .0.0320.9770.032
set.seed(17)
#
# Study a sample of 10,000.
#
Sample <- rbeta(10^4, 20.4626, 0.4817)
hist(Sample)
hist(replicate(10^3, mean(rbeta(10^4, 20.4626, 0.4817))),xlab="%",main="1000 Sample Means")
#
# Analyze a sample designed to achieve a CI of width 1%.
#
(n.sample <- ceiling((0.032 / (0.005 / qnorm(1-0.005)))^2))
Sample <- rbeta(n.sample, 20.4626, 0.4817)
cat(round(mean(Sample), 3), round(sd(Sample), 3)) # Sample statistics
se.mean <- sd(Sample) / sqrt(length(Sample)) # Standard error of the mean
cat("CL: ", round(mean(Sample) + qnorm(0.005)*c(1,-1)*se.mean, 5)) # Normal CI
#
# Compare the bootstrapped CI of this sample.
#
Bootstrapped.means <- replicate(9999, mean(sample(Sample, length(Sample), replace=TRUE)))
hist(Bootstrapped.means)
cat("Bootstrap CL:", round(quantile(Bootstrapped.means, c(0.005, 1-0.005)), 5))