신뢰 구간 대 표본 크기?


9

나는 통계와 신뢰 구간에 완전히 익숙하지 않습니다. 따라서 이것은 매우 사소하거나 어리석은 소리 일 수 있습니다. 이 점을 더 잘 설명하는 문헌 / 텍스트 / 블로그를 이해하거나 알려 주시면 감사하겠습니다.

CNN, Fox 뉴스, Politico 등과 같은 다양한 뉴스 사이트에서 2012 년 미국 대통령 선거에 관한 여론 조사에 대해 알았습니다. 각 기관은 여론 조사를 실시하고 다음과 같은 형식의 통계를보고합니다.

CNN : 오바마의 인기는 X %이며 오차 한계는 +/- x1 %입니다. 샘플 크기 600. FOX : 오바마의 인기는 Y %로 오차 한계 +/- y1 %입니다. 샘플 크기 800. XYZ : 오바마의 인기는 Z %이며 오차 한계는 +/- z1 %입니다. 표본 크기 300.

내 의심은 여기있다 :

  1. 어느 것을 신뢰할 것인지 어떻게 결정합니까? 신뢰 구간을 기준으로해야합니까, 아니면 Fox가 표본 크기가 더 크기 때문에 추정값이 더 신뢰할 수 있다고 가정해야합니까? 하나를 지정하면 다른 하나를 지정할 필요가 없도록 신뢰 이너 벌과 표본 크기간에 암시 적 관계가 있습니까?

  2. 신뢰 구간에서 표준 편차를 확인할 수 있습니까? 그렇다면 항상 유효하거나 가우시안과 같은 특정 분포에 대해서만 유효합니까?

  3. 위의 세 가지 추정치를 "병합"하거나 "결합"하고 신뢰 구간과 함께 내 추정치를 얻을 수있는 방법이 있습니까? 이 경우 어떤 샘플 크기를 청구해야합니까?

나는 CNN / Fox에 대해서만 언급했다. 나는 여기서 민주당 vs 공화당 토론을 시작할 의도가 없다.

내가 제기 한 문제를 이해하도록 도와주세요.

답변:


4

Peter의 훌륭한 답변 외에도 다음은 특정 질문에 대한 답변입니다.

  1. 누가 신뢰할 것인지는 누가 설문을하고 있는지, 그리고 양질의 설문을 얻기 위해 어떤 노력을 기울 였는지에 달려 있습니다. 표본이 대표적이지 않고 대규모 폴링을 수행하는 경우 표본 크기가 클수록 좋지는 않지만 하나의 비 흔들림 상태에서만 결과가 좋지 않습니다.

    표본 크기와 신뢰 구간의 너비 사이에는 관계가 있지만 백분율이 0, 1 또는 0.5에 얼마나 가까운 지와 같은 다른 것들도 너비에 영향을줍니다. 사용 된 바이어스 조정, 샘플 채취 방법 (클러스터링, 계층화 등) 일반적으로 신뢰 구간의 너비는 비례 하므로 표본 크기의 4 배가 필요한 구간을 절반으로 줄입니다.1n

  2. 표본 수집 방법과 구간 계산에 사용 된 공식에 대해 충분히 알고 있으면 표준 편차를 해결할 수 있습니다 (사용되는 신뢰 수준, 일반적으로 0.05). 그러나 공식은 계층화 된 샘플과 클러스터 샘플의 경우 다릅니다. 또한 대부분의 설문 조사는 백분율을 보이므로 이항 분포를 사용합니다.

  3. 정보를 결합하는 방법이 있지만 일반적으로 표본을 수집 한 방법에 대해 알고 있거나 간격이 구성된 방식에 대한 가정을 기꺼이 만들어야합니다. 베이지안 접근 방식이 한 가지 방법입니다.


1
+1. 그러나 # 3에 대한 전망이 너무 어둡거나 어려울까요? 각각 자체 오차 한계가있는 독립 추정치 모음이있는 경우 일반적인 방법으로 (적어도 대략적으로) (가중 평균으로, 제곱 MoE로 가중 가중치를 적용) 표준 오차를 다음과 같이 결합 할 수없는 이유는 무엇입니까? 잘 (분산 공식 사용)? 완벽하지는 않지만 신뢰할 수있는 설문을 하나 선택하는 것보다 낫습니다.
whuber

고마워 그렉! 답변 해 주셔서 감사합니다. 질문 3에 대한 답변에서 "베이지안 접근 방식은 한 가지 방법"이라고 언급했습니다. 이에 대한 자세한 정보를 제공하는 문헌을 알려 주시겠습니까?
Nik

@ whuber : 귀하의 의견에 감사드립니다. 그것이 내가 생각한 것입니다. 이러한 추정치를 이러한 방식으로 결합하는 것이 정당하다고 생각하십니까? 완전히는 아니지만 크게 될 수 있습니까?
Nik

1
@ whuber, 나는 포스터가 알고 있고 필요한 가정에 따라 살 수 있는지 확인하기 위해 황량한 것으로 칠하지 않았습니다.
Greg Snow

@Nik, 웹에 베이지안 통계에 대한 많은 자습서가 있습니다. 간단한 접근 방식 (샘플이 모두 단순한 임의의 샘플이거나 설문 설계가 SRS 가정이 그리 멀지 않은 것으로 가정)은 베타 이전에 시작한 다음 각 설문을 이항 가능성으로 사용하는 것입니다. 새로운 후부를 구하십시오. Bayes 접근 방식의 한 가지 좋은 점은 가장 최근의 여론 조사만큼 영향력을 갖지 않으려면 이전 연구의 효과를 할인 할 수 있다는 것입니다.
Greg Snow

4

이것은 큰 주제이지만 기본적으로 두 가지 문제가 있습니다.

1) 정밀도-샘플 크기에 따라 결정됩니다. 표본이 클수록 표준 오차가 낮아지고 신뢰 구간이 더 엄격 해져보다 정확한 추정치가 제공됩니다.

2) 바이어스-통계 상 다른 곳에서 부정적인 의미를 가질 필요는 없습니다. 여론 조사에서 그들은 무작위로 XXXX 샘플을 얻습니다 (때때로 유권자, 때로는 등록 유권자 일 수도 있음). 그러나 그들은 그렇지 않습니다. 일부 여론 조사에서는 유선 만 사용합니다. 다른 그룹의 사람들이 대답 할 가능성이 다소 있습니다. 다른 그룹은 전화를 끊을 가능성이 다소 있습니다.

그래서 모든 여론 조사원들은 그들의 반응에 가중치를 부여합니다. 즉, 유권자에 대해 알려진 사실과 일치하도록 결과를 조정하려고합니다. 그러나 그들은 모두 조금 다르게합니다. 따라서 동일한 폴링 입력 데이터를 사용하더라도 다른 숫자를 제공합니다.

누가 신뢰해야합니까? 글쎄, 당신이 538에 관한 네이트 실버의 작품을 보면, 그는 이전 선거에서 얼마나 정확한 설문 조사가 있었는지에 대한 등급을 가지고 있습니다. 그러나 이것이 그들이 똑같이 정확하다는 것을 의미하지는 않습니다.


고마워 피터 따라서 오차 한계가 낮은 추정치가 더 '정확합니다'. X % +/- x1 % 오류 한계에서 어떻게 바이어스되는지 알 수있는 방법이 있습니까? 개별 샘플의 선호도를 알지 못하면 불가능할 것 같습니다.
Nik

네 맞습니다. 물론, 일부 여론 조사원은 알려진 편견 (한 방향 또는 다른 방향)을 가지고 있습니다. 내부 설문 조사 (한 쪽 또는 다른 쪽에서 실행)는 종종 편향됩니다. 그들이 할 수있는 한 가지 방법은 몇 가지 여론 조사를 실행하고 유리한 투표 만 공개하는 것입니다. 그런 다음 후보자에 대한 질문이 그에 대한 부정적인 질문으로 시작되는 "푸시 설문 조사"의 전체 문제가 있습니다.
Peter Flom

1

이것은 설문 조사 샘플링 영역에 해당합니다. 무작위 화가 사용되기 때문에 원칙적으로 방법이 작동합니다. 다음은 주관적인 결정에 따라 여론 조사에서 다를 수있는 사항입니다.

  1. 샘플링 프레임. 샘플을 뽑는 유권자 그룹은 무엇입니까?

  2. 어제 여론 조사 또는 다음 주에 따라 오바마 vs 롬니에 대한 의견을 바꿀 수있는 미정의 유권자의 변동성을 어떻게 처리합니까?

  3. 베드로는 편견에 손을 대었다. 1936 년 문학 다이제스트 여론 조사는 재앙이었다. 샘플링 프레임은 임의의 전화 번호 선택을 기반으로했기 때문에 FDR보다 공화당 후보를 선정했습니다. 1936 년에는 중상류층과 부유층 만이 전화기를 가지고있었습니다. 이 그룹은 공화당 후보에 투표하는 경향이있는 공화당이 지배했다. 루즈 벨트는 산사태로 승리하여 빈민층과 중산층으로부터 많은 표를 얻었습니다. 이는 샘플링 프레임의 미묘한 선택으로 인한 바이어스를 나타냅니다.

  4. 설문 조사 샘플링은 유한 모집단을 처리합니다. 모집단 크기는 N입니다. 해당 모집단에서 간단한 랜덤 표본을 추출하여 크기가 n이라고 가정합니다. 간단히하기 위해 오바마와 롬 니만 가동한다고 가정합니다. 이 샘플링 프레임에서 오바마가 얻을 수있는 투표 비율은 이진 변수의 평균입니다 (응답자가 오바마를 선택하면 1, 롬니는 0). 이 변수에 대한 표본 평균의 분산은 [p (1-p) / n] [Nn] / N입니다. 여기서 p는 오바마를 선택하는 실제 모집단 프로 포르 틴입니다. [Nn] / N은 유한 모집단 수정입니다. 대부분의 여론 조사에서 N은 N보다 훨씬 크며 올바른 것은 무시할 수 있습니다. p (1-p) / n을 보면 분산이 n과 함께 감소하는 것을 볼 수 있습니다. 따라서 n이 크면 주어진 신뢰 수준의 신뢰 구간이 작아집니다.

미국 인구 조사국의 다른 설문 조사 표본 수집가 및 통계학자는 모두 이러한 통계 도구를 사용할 수 있으며보다 복잡하고 정확한 방법 (클러스터 무작위 표본 및 계층화 된 무작위 표본 추출을 통해 몇 가지 방법을 언급)을 수행합니다.

그들의 모델링 가정이 유효 할 때, 방법은 놀랍도록 잘 작동합니다. 종료 폴링이 대표적인 예입니다. 선거 당일에는 거의 모든 주에서 네트워크가 거의 최종 계산에 앞서서 정확하게 우승자를 볼 수 있습니다. 선거일 변동성이 사라졌기 때문입니다. 그들은 사람들이 투표하는 경향을 역사적으로 알고 있으며 편견을 피하는 방식으로 선택된 선거구를 결정할 수 있습니다. 네트워크는 때때로 다릅니다. 이것은 다른 정신보다 승자를 선택하는 경쟁으로 인한 것일 수 있습니다. 드문 경우지만 투표가 매우 가깝기 때문에 가능합니다 (예 : 플로리다의 대통령 선거 2000).

나는 이것이 당신에게 무슨 일이 일어나고 있는지 더 명확하게 보여주기를 바랍니다. 우리는 더 이상 1948 년 "듀이가 트루먼을 물리 친다"나 1936 년의 문학 다이제스트와 같은 중대한 실수를 겪지 않습니다.


자세한 설명을 주셔서 감사합니다. 정말 도움이되었습니다!
Nik

더 이상 중대한 실수가 보이지 않습니까? 클린턴은 2016 년에 이겼습니다. 나는 당신의 알려진 미지수를 가지고 당신에게 검은 백조를 올립니다 . 아빠가 예전처럼 "당신을 모르는 것이 당신을 죽입니다."
Carl

1
저의 대답은 클린턴과 2016 년 선거와는 별다른 문제가 없었습니다. (1) 러시아의 개입, (2) 클린턴이 대중 투표에서 승리했으며 (3) 일부 트럼프 유권자들은 트럼프에 투표 할 것을 인정하기 위해 회개했습니다. 유권자 투표율이 예상과 다른 경우 여론 조사가 잘못 될 수 있다고 덧붙여 야합니다.
마이클 R. 체닉
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.