대규모 모집단을 폴링 할 때 표본 크기를 어떻게 결정합니까?


15

호주는 현재 선거를 진행하고 있으며 언론은 매일 새로운 정치 여론 조사 결과를보고합니다. 통계적으로 유효한 결과를 얻으려면 2,200 만 명의 국가에서 인구의 몇 퍼센트를 샘플링해야합니까?

너무 큰 샘플을 사용하면 결과에 영향을 줄 수 있습니까, 아니면 샘플 크기에 따라 통계적 유효성이 단조 증가합니까?

답변:


13

표본 크기는 모집단 크기에 크게 의존하지 않으므로 많은 사람들에게 반 직관적입니다.

대부분의 설문 조사 회사는 표본에 400 명 또는 1000 명을 사용합니다.

이에 대한 이유가 있습니다.

400의 표본 크기는 20에서 95의 +/- 5 %의 신뢰 구간 (95 %)을 제공합니다.

1000의 표본 크기는 20에서 95의 +/- 3 %의 신뢰 구간 (95 %)을 제공합니다.

어쨌든 50 %에 가까운 비율을 측정 할 때.

이 계산기는 나쁘지 않습니다.

http://www.raosoft.com/samplesize.html


6
그러나 이것은 모두 동종 집단의 샘플링을 기반으로합니다. 이기종 모집단 (예 : 여러 하위 그룹에 대해 다른 비율, 모집단의 희귀 부분 샘플링)이있는 경우 해당 분산 추정치는 그다지 신뢰할 수 없습니다. 여기에서 실제로 계산하는 추정치는 표본이 나타내는 모집단에 대한 것입니다. 문제는이 인구가 실제로 관심있는 사람입니까?
chanceislogic

9

특정 후보에 대해 투표 할 사람의 비율을 알고 싶다고 가정합니다 (예 : , 정의상 π 는 0과 100 사이 임). N 투표자를 무작위로 샘플링 하여 투표 방법을 확인하고 N 투표자에 대한 귀하의 설문 조사에 따르면 백분율은 p 입니다. 따라서 실제 백분율에 대한 신뢰 구간을 설정하려고합니다.ππNNp

당신이 가정하면 일반적으로 (또는 얼마나 '큰'에 따라 정당화 될 수도 있습니다 가정 분포 N 다음에 대한 신뢰 구간입니다) π는 형식은 다음과 같습니다 C I을 = [ P - 케이 * D ( p ) , p + k * s d ( p ) ] 여기서 k 는 원하는 신뢰도 (95 % 또는 99 % 등)에 따라 달라지는 상수입니다.pNπ

CI=[pksd(p),  p+ksd(p)]
k

MoE=ksd(p)

sd(p)p=Xi/NXi=1i0

Xi

Var(P)=V(XiN)=V(Xi)N2=Nπ(1π)N2=π(1π)N.
sd(p)=π(1π)N
πsd(p)π=0.5
sd(p)=0.50.5/N=0.5/N
NN

k=1.96N=1000

[p1.960.51000,  p+1.960.51000]=[p0.03,  p+0.03]
NNπ=50%

2

대략적인 일반화로 모집단에있는 사람들의 일부를 샘플링 할 때마다 같은 수 (다수의 사람들)를 다시 샘플링하는 경우와는 다른 대답을 얻게됩니다.

따라서 호주에서> = 30 세인 사람의 수를 확인하고 실제 비율 (하나님이 우리에게 말한 것)이 정확히 0.4 인 경우, 100 명을 요청하면 평균 수를 기대할 수 있습니다. > = 30이 100 x 0.4 = 40이고 해당 숫자의 표준 편차가 +/- sqrt (100 * 0.4 * 0.6) = sqrt (24) ~ 4.9 또는 4.9 % (바이 노미 분포)라고 가정하십시오.

제곱근이 있기 때문에 표본 크기가 100 배 증가하면 표준 편차가 10 배 감소합니다. 따라서 일반적으로 이와 같은 측정의 불확실성을 10 배로 줄이려면 100 배 많은 사람을 샘플링해야합니다. 따라서 100 x 100 = 10000 명을 요청하면 표준 편차는 49까지 또는 백분율로 0.49 %로 내려갑니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.