Brexit : 통계적으로 유의 한“탈출”이 있었습니까? [닫은]


12

이 포스트에서 우리는 인간 이라고 불리는 자연 현상에 대한 질문 을하여 투표를 세어 결정을 찾으려고 시도합니다 . 이 질문에 관한 자연 현상의 구체적인 사건은 Brexit 의 경우입니다 .

참고 : 문제는 정치에 관한 것이 아닙니다. 목표는 관찰에 기초한 통계적 관점에서 그러한 자연 현상을 논의하는 것입니다.

구체적인 질문은 다음과 같습니다.

  • 질문 : 뭐라고합니까 Brexit 투표가 떠날 뜻? 예를 들어 대중이 실제로 EU를 떠나기를 원한다는 의미입니까? 단순히 대중이 확실하지 않으며 생각할 시간이 더 필요하다는 의미입니까? 아니면 다른 것입니까?51.9%

가정 1 : 투표 과정에 오류가 없습니다.


14
민주주의는 통계적 중요성에 관한 것이 아닙니다 . 51.9 % 결과는 투표 한 사람 중 51.9 %가 "탈퇴"로 투표 한 것을 의미합니다. 이것은 여론 조사가 아닙니다. 투표하지 않은 사람들은 발로 투표하지 않았습니다. "공공은 확실하지 않으며 생각할 시간이 더 필요하다"는 의미로 51.9 %를 해석하는 것은 단순히 통계에 달려 있습니다. Brexit은 확률 1로 일어났다.
Tim

7
이 실은 비 통계적이며, 의견이 있고, 심지어 극론적일 수도 있습니다. 인기도에 관계없이이 사이트에는 적합하지 않습니다. 우리는 그러한 대화에 더 참여하기를 원하는 사람들로 채워진 대화방을 가지고 있습니다 : 그것을 확인하십시오!
whuber

2
나는 현재 논의가 통계적으로 집중되어 있고 통계 테스트에 적용되는 투표 결과를 해석하는 좋은 예라고 생각합니다.
Underminer 2016 년

3
설문 조사와 같은 여론 측정 지표의 측정 오류와 같은 중요한 문제가 발생합니다. 주요 오류 원인이 표본 크기가 아닌 것 같습니다.
Aksakal

4
IMHO, 이것은 사실을 위장하기 위해 통계의 얇은 비니어가 추가 된 비 통계적 질문입니다. 내가 읽은 것처럼 "투표 과정에 오류가 없다"는 가정은 모든 통계적 고려 사항을 제거하고 민주주의에서 "투표 ...의 의미"에 대한 논의를 이끌어 내야합니다. 그것은 통계가 아니라 정치와 철학의 문제입니다.
whuber

답변:


17

샘플링 오류가 없지만 샘플이 크지 않고 샘플링이 포함 되지 않았기 때문에 @Underminer에 동의합니다 . 투표 할 사람은 아무도 없었습니다. 투표하고 싶었지만 투표 할 수 없었거나 (예 :이 날에 자동차 사고를 당하지 않았거나) 잘못된 투표를 한 사람들 중 무시할만한 부분이 분명히 있었지만, 여기에서 유일한 "샘플링"입니다.

결과는 정확 합니다. 전체 인구가 투표에 참여한 이후 오류가 발생 하지 않았습니다 (일부는 참여하지 않음). 어떤 사람들 투표 하기로 결정 했지만 어떤 사람들 투표하지 않았습니다. 일부 휴가에 투표 하기로 결정 했지만 일부는 그렇지 않았습니다. 민주주의는 없습니다 하지만 약, 통계적 유의성에 대해 정말 일어났다 . 투표는 사람들의 의견을 배우기위한 것이 아니라 결정을 내리기위한 것입니다. 실제로 사람들은 때때로 자신의 생각에 따라 투표하지 않고 무언가를 나타내거나 달성하기 위해 투표 합니다 . 예를 들어, 선거에서 사람들은 자신이 선호하는 후보자에게 투표하는 것이 아니라 그들이 이길 확률이 더 높다고 생각하면 선호하는 두 번째 후보에게 투표 할 수 있습니다.


투표 인구가 자신에게 무엇이 좋은지 잘 모르는 회색 영역의 경우를 고려하십시오. 예를 들어, 거의 똑같이 좋은 두 후보가있는 경우입니다. 이 경우, 투표 한 사람들은 투표 결과가 균일 한 분포에 가까워 질 수 있으므로 시스템 적으로 다를 수 있다고 생각합니다. 여기서 나의 목표는 민주주의 (정치적 주제)를 재정의하는 것이 아니라 Brexit이 회색 영역인지 여부에 대해 무엇을 말할 수 있는가?
원시인

2
@caveman 확신이 있든 없든간에 중요한 것은 투표가 실제 투표에 관한 것이므로 투표 한 방식입니다. 확실히, 어떤 사람들은 투표를하고 어떤 사람들은 투표를하지 않은 채 분명한 의견을 가지고 있지 않았지만, 투표 한 사람들의 실제 투표 수는 중요하기 때문에 이것은 중요하지 않습니다.
Tim

내가 올바르게 이해한다면 민주주의가 표를 어떻게 해석하는지에 대한 요점이 있습니까? 동의합니다. 그러나 저는 정치인들이하는 방식으로 해석하지 않습니다. 의사 결정이 좋은지 나쁜지 또는 명확하지 않은지 식별하기 위해 인구를 사용하려고합니다. 이것은 투표의 다른 사용법입니다.
원시인

2
@caveman 사람들은 시간이 지남에 따라 마음을 바꾼다. 심리학자들은 이것에 관해 수천 편의 논문을 썼다 ... 그렇다. 사람들은 심지어 줄의 길이를 비교하는 것에 대해 확신 할 수 없습니다 ( en.wikipedia.org/wiki/Asch_conformity_experiments ) ...
Tim

1
@ Aksakal 나는 누가 투표 자격이 있고 누가 투표에 참여할 수 있는지에 대해서는 언급하지 않을 것입니다. 또한 필요한 자격 증명을 얻는 것이 얼마나 어려운지에 대해서는 언급하지 않겠습니다. 그것은 정치이며 여기서 주제가 아닙니다. 통계적 관점에서 볼 때 각 유권자 투표는 투표하지 않을 확률이 있습니다. 이 확률은 선호도와 관련이있을 수도 있고 그렇지 않을 수도있는 특정 요인에 의해 영향을받을 수 있지만, 유자격 유권자는 각자의 재량에 따라 그 권리를 행사하기로 결정합니다.
user3697176

9

51.9 %는 탈퇴 하려는 유권자의 비율입니다 . 샘플 크기가 너무 커서 (> 3300 만 이상) 사실상 임의 샘플링 오류가 없습니다.

통계적 유의성 검정은 잔차휴가 의 차이 가 무작위 샘플링 오류만으로 설명 될 수 있는지 여부를 결정하려고 시도하며 , 그 차이는 확실히 유의할 것입니다 (@caveman의 답변 참조).

이 접근법의 문제점은 통계적 유의성이 샘플이 투표하는 사람들 만이 아니라 전체 인구 (영국 전체)를 대표한다는 가정을 매우 강력하게한다는 것입니다.

비 응답률 (투표하지 않는 비율)은 영국 전체의 절반 이상이 '탈퇴'를 원하고 측정하기 어려운지를 결정하는 데 매우 중요합니다. 무응답 편견은 투표 할 가능성이 적은 하위 그룹이 체계적으로 다른 견해를 가질 때 만들어집니다. 출구 조사를 바탕으로, 예를 들어, 밀레니엄 세대는 덜 투표 가능성이 있지만, 가능성이 투표에 있었다 남아있는 영국의 모든 인구를 대표 할 때 편견이있는 결과를한다.

이러한 이유로 전통적인 의미에서 통계적 유의성 테스트 는 대체로 부적절 합니다.


가정 : 우리는 투표가 성취하려는 것에 대한 정치적 논의를 피하고 이해하기 위해이 용어에 대한 용어를 정의해야합니다. 내 정의는 다음과 같습니다.

인구 : 영국에 거주하는 모든 사람

샘플링 프레임 : 투표 할 수있는 모든 투표 자격이있는 사람

샘플링 방법론 : 자발적 대응, 투표 행위가 설문에 참여

샘플 : 실제로 투표 한 개인

이 설정에서, 샘플 비율은 향하다 모든 사람의 비율 추정 (좋든 나쁘 든) 사용할 수 유지 (또는 휴가 ).


8

물어

51.9 % Brexit 투표는 무엇을 의미합니까?

유권자들의 51.9 %가 떠나기로 투표했음을 의미합니다.

예를 들어 대중이 실제로 EU를 떠나기를 원한다는 의미입니까? 단순히 대중이 확실하지 않으며 생각할 시간이 더 필요하다는 의미입니까? 아니면 다른 것입니까?

17421887161462971293135318

귀하의 질문에 응답하여 설문지를 작성하는 것이 가능했을 수도 있습니다. 이것은 실행 된 국민 투표에서 일어난 일이 아닌 것 같습니다.


1
유권자 (즉, 전체 인구가 아닌)와 관련하여 투표의 의미가 " 51.9 % 투표 휴가 "를 의미한다는 표면적 인 결론을 넘어서 논의 해 주 시겠습니까? 우리가 이것으로부터 추출 할 수있는 정보의 범위가 무엇인지 궁금합니다.
원시인

4
이 의견은 다른 어떤 것보다 원시인이 귀하의 질문이 통계적이지 않다는 것을 보여줍니다. 51.9 % (총 수와 함께) 가 유권자에 대한 증거의 모든 데이터를 구성 하고 불확실성이 없기 때문에 (별도의 문제인 계산의 정확성에 이의를 제기하지 않는 한)이 답변의 거부는 암시합니다 비 통계적인 결론을 찾고 있습니다.
whuber

Brexit을 이진 분류 문제로 모델링하고 유권자를 앙상블의 구성원 인 분류 자의 추정치로 간주하면 어떨까요? 이 모델에서 목표는 대다수의 시민이 원하는 것을 식별하는 것이 아니라, 분류 자의 공간에서 최적의 분류기를 식별하는 것입니다. 그런 다음 몇 가지 측정 값을 사용하여 이러한 투표자 기반 분류기 앙상블의 장점을 테스트 할 수 있습니다. 예를 들어 우리는 근본적인 사실을 알 수없는이 이진 분류 작업에 적합한 Perplexity 또는 다른 것을 사용할 수 있습니다 (예 : 휴가가 남는 것보다 낫다는 것을 분명히 알 수 없음).
원시인

@caveman : 기본 진리가 (올바르게) 알려지지 않았다면, "분류기 공간에서 최적의 분류기를 식별하기 위해"어떤 메트릭을 사용 하시겠습니까? 이러한 메트릭은 "투표 결과를 재현합니다"라는 메트릭을 제외하고 메트릭을 선택하는 분석가의 편견을 인코딩합니다.이 메트릭에 대한 답은 이미 51.9 % / 48.1 %입니다.
Eric Towers

- 나는 다른 방법에 대해 얘기 곳 @EricTowers 나는 politics.stackexchange.com이 촬영했습니다 politics.stackexchange.com/questions/11433/...
원시인

2

TL; DR

R=100051.9%51.9%

0

48.1%

0

따라서 나는 Brexit 투표가 확실치 않거나 혼란스러워하는 인구 의 시끄러운 부작용이 아니라고 결론 지었다 . 그들이 EU를 떠나도록 유도하는 체계적인 이유가있는 것 같습니다.

여기에 시뮬레이터 코드를 업로드했습니다 : https://github.com/Al-Caveman/Brexit

세부

가정 1가 주어지면 가능한 답은 다음과 같습니다.

  • H0
  • H1

참고 : 투표 오류를 배제했기 때문에 대중이 자신있게 남아 있기를 원하는 것은 불가능 합니다.

H0H1

  • 51.9%
  • 151.9%

H1H0

이 확률을 측정하려면 Brexit과 같은 이진 투표 시스템에서 확실하지 않은 영국 인구 의 분포를 알아야합니다 . 따라서 첫 번째 단계는 아래 가정에 따라이 분포 를 시뮬레이션 하는 것입니다.

  • 가정 2 : 확실하지 않은 개인 으로 구성된 모집단 은 무작위 기회 투표를합니다. 즉, 가능한 모든 대답은 동일한 선택 기회가 있습니다.

제 생각에는이 가정은 공정하고 합리적입니다.

또한 휴가 및 캠페인 유지 를 다음과 같이 두 가지 고유 한 프로세스로 모델링합니다 .

  • PleaveOleave=[l1,l2,,ln]
  • PremainOremain=[r1,r2,,rn]

어디:

  • n
  • i{1,2,,n}li,ri{0,1}01

다음 제약 조건이 적용됩니다.

  • i{1,2,,n}liri1li=1ri=0ri=1li=0i{1,2,,n}

Oleave=[1,0,0]3

Oremain=[0,1,0]3

Oleave[3]=Oremain[3]=0

33,568,18451.9%10051.9=48.1%

  • n=33,568,184
  • 33,568,184×0.519=17,421,887.496
    i=133,568,184Oleave[i]=17,421,887.49617,421,887
  • 33,568,184×(10.519)=16,146,296.504
    i=133,568,184Oremain[i]=16,146,296.50416,146,297

따라서 출력 배열을 다음과 같이 정의합니다.

  • i{1,2,,17421887}Oleave[i]=1
  • i{17421887+1,17421887+2,,33568184}Oleave[i]=0
  • i{1,2,,17421887}Oremain[i]=0
  • i{17421887+1,17421887+2,,33568184}Oremain[i]=1
  • i{1,2,,33568184}Ounsure,m[i]=CC{0,1}mOunsure,mOunsure,mOunsure,1=Ounsure,20.533,568,184

pleave

pleave=1Rm=1R{1if (i=133,568,184Oleave[i])(i=133,568,184Ounsure,m[i])0else
ROunsure,m 정의됩니다.

premain

premain=1Rm=1R{1if (i=133,568,184Oremain[i])(i=133,568,184Ounsure,m[i])0else

R=1,000

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

다시 말해:

  • pleave=0
  • premain=0

2
이 경우 비 응답률 (즉, 투표권이없는 개인)이 더 중요 할 수 있습니다. 오차 한계 (또는 통계적 유의성 측정)는 무작위 표본 오차 만 고려합니다. 무응답 바이어스는 여기에 포함되지 않으며, 이러한 샘플 크기가 큰 폴링에서는 랜덤 샘플링 오류보다 훨씬 영향이 큽니다.
Underminer 2016 년

46,499,53746,499,537(17421887+16146297)=12,931,353

3
비 랜덤 결측 데이터를 처리하는 통계적으로 만족스러운 방법은 없습니다.
Underminer 2018 년

투표하지 않은 사람들은 정치에 관심이없는 사람들로 구성 될 수 있습니다 (예 : 더 이상 신뢰하지 않음). 대안으로, 그러한 투표권자는 확실하지 않은 사람들 일 수 있습니다. 또는이 둘의 혼합 일 수 있습니다. " 모든 unvoter가 확실하지 않다 " 고 가정하면 어떻게됩니까? 현재 상황이 일반인이 Brexit이 회색 영역 이라고 느끼는 상황인지 테스트하기위한 상한 일까요?
원시인

3
통계의 본질과 범위에 대해 혼동이 있습니다. 투표 의 프로세스 모델 을 작성하려고하며 ,이를 통해 거버넌스 및 공개 의사 결정의 메커니즘 및 유효성을 알 수있는 방법을 제시합니다. 이것은 정치 과학에서 가치있는 일 입니다. 통계가 아닙니다 (통계가 관련되어 있음).
gung-Monica Monica 복원

1

약간 다른 질문을 할 수 있습니다. 매우 큰 인구의 50 %가 "예"로 투표하고 크기가 S 인 임의 표본을 물었다 고 가정하면 표본의 51.9 %가 "예"로 응답 할 확률은 얼마입니까? 표본의 크기?

S1/2

S1/2(6.10.5/0.019)2


0

이것은 시뮬레이션 대신 분석 방법을 사용하는 또 다른 솔루션입니다.

n0.5

51.9%17,421,887Oleave0.533,568,18417,421,887+10.533,568,184

17,421,887

i=17,421,88733,568,1840.533,568,184=(33,568,18417,421,887)×0.533,568,184=8.39663381928984×10101050240

( 에 의해 계산 울프 럼 알파 )8.39663381928984×1010105024

그리고이 갖는 확률 확신 인구 투표 휴가를 .51.9%

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.