1000 개 중 600 개가 10 개 중 6 개보다 설득력이 좋은 이유는 무엇입니까?


41

155 페이지 스텔라 코텔 (Stella Cottrell)의 "Palgrave, 2012"의 "연구 기술 핸드북"에서 발췌 한 내용을보십시오.

백분율 백분율이 주어지면 통지하십시오.
대신, 위의 문장이 다음과 같다고 가정하십시오.

60 %의 사람들이 오렌지를 선호했습니다. 40 %는 사과를 선호한다고 말했다.

이것은 설득력있는 것처럼 보입니다 : 수치 적 수량이 주어집니다. 그러나 60 %와 40 %의 차이가 중요 합니까? 여기서 우리는 얼마나 많은 사람들이 요청되었는지 알아야합니다. 600 명이 선호되는 오렌지를 1000 명에게 물었다면 그 수는 설득력이있을 것입니다. 그러나 10 명만 요청한 경우 60 %는 단순히 6 명이 오렌지를 선호한다는 의미입니다. "60 %"는 "10 개 중 6 개"가 아닌 방식으로 설득력있는 소리를냅니다. 중요한 독자는 불충분 한 데이터를 인상적으로 보이기 위해 사용되는 백분율을 주시해야합니다.

통계에서이 특성은 무엇입니까? 그것에 대해 더 자세히 읽고 싶습니다.


38
샘플 크기 문제
Aksakal

36
저는 두 사람을 무작위로 고르고 둘 다 남성이므로 미국인의 100 %가 남성이라는 결론을 내립니다. 설득력 있는?
Casey

2
"
주황

2
다른 각도에서 그 질문에 접근하기 위해 프레이밍 효과에 대한 문헌을 파는 것을 고려할 수 있습니다. 그러나 그것은인지 편향의 예이며 통계가 아닌 심리적 주제입니다.
Larx

2
예상 수량에 얼마나 영향을 미치는지 1의 차이를 상상할 수 있습니다. 7/10은 601/1000이 600/1000보다 6/10보다 훨씬 더 상대적입니다.
mathreadler

답변:


54

또 다른 직관적 인 예를 들겠습니다.

동전 뒤집기의 결과를 예측할 수 있다고 가정합니다. 당신은 내 능력을 믿고 시험하고 싶지 않습니다.

당신은 5 번 시험을했는데 모두 다 맞았습니다. 내가 특별한 능력을 가지고 있다고 생각합니까? 아마. 우연히 모든 것을 얻을 수 있기 때문입니다. (특히, 동전이 공정한 동전이고 각 실험이 독립적이라고 가정하면 초능력없이 으로 모든 권리를 얻을 수 있습니다 . 이에 대한 농담은 Shufflepants의 링크 를 참조하십시오 ).0.550.03

반면에, 당신이 나를 여러 번 시험했다면, 우연히 얻을 수있는 것 같지는 않습니다. 예를 들어, 번 테스트 한 경우 모두 올바르게 얻을 확률은 0.5 1000 입니다.1000.51000


통계 개념을 Wikipeida의 통계적 힘이라고합니다.

이진 가설 검정의 검정력은 대립 가설 (H1)이 참일 때 검정에서 귀무 가설 (H0)을 올바르게 기각 할 확률입니다.

동전 던지기의 초강력 예제로 돌아가서 기본적으로 가설 테스트를 실행하려고합니다.

  • 귀무 가설 (H0) : 나는 초능력이 없다
  • 대립 가설 (H1) : 나는 초능력

수치 예제 (5 번 테스트, 100 번 테스트)에서 알 수 있듯이 통계 검정력은 표본 크기의 영향을받습니다.

자세한 내용은 여기를 참조하십시오 . (보다 기술적이고 t- 테스트를 기반으로 함).

통계적 힘을 이해하기위한 대화식 도구는 여기 에서 찾을 수 있습니다 . 통계적 검정력은 표본 크기에 따라 달라집니다!

여기에 이미지 설명을 입력하십시오


24
의무적 인 XKCD
셔플 팬츠

5
이것은 실제로 질문에 대답하지 않습니다. 이 질문은 "왜 더 설득력이 있는가?"와 "통계에서이 특성이 무엇입니까?"라는 두 부분으로 구성됩니다. 독자가 예제를 통해 더 확신하는지 묻는 예제를 제공했지만 현상을 설명하지 않았고 더 설득력있는 이유 를 설명하지 않았습니다 (단독 예제에 대한 독자의 직관적 추론에 의존하기 만 함). 또한 두 번째 질문에 대해서는 언급하지 않았습니다.이 현상에 이름이 없다고 생각되면 명시 적으로 명시하십시오.
Makyen

1
@ Mayen 그것은 분명히 시도 된 답변입니다. 그것은 가장 큰 답이 아니며 완전한 답은 아니지만 부분적이거나 민주적 인 답은 답이 아니라고 주장하는 근거가 아닙니다. 질문은 하나의 질문을해야하며 일련의 질문을하는 경우 일부 질문 만 다루는 것이 합리적이라고 생각합니다 (이상적이지 않은 경우). 답 이 좋지 않다고 생각되면 문제라고 생각 하는 문제를 자유롭게 해결할 수 있습니다. [그 문제에 대해서는 두 번째 질문에도 대답하지 않았다고 생각합니다. 나는 그 효과에 대해서만 논의했다. 모든 현상에 명확한 이름이있는 것은 아닙니다.]
Glen_b

1
나는 도울 수는 없지만 100 %가 특별한 경우라고 생각 하며이 답변은 600/1000이 6/10보다 더 설득력이 있다는 내 직감을지지하지 않습니다. 우리가 특별한 경우가 아니라고 생각하더라도 본질적으로 다른 비율로 문제를 해결하는 것입니다.
NotThatGuy

2
@ Juya 그것은 누군가가 만든 웹 기반 도구입니다. 당신은 여기에서
Haitao Du

29

μ=# of sucessesn

이 수량의 표준 오차는 μ(1μ)n.155.0155 . 따라서 기본적으로 의견에서 언급했듯이 "샘플 크기가 중요합니다."


17

이 개념은 많은 수법칙의 결과입니다 . 에서 위키 백과 ,

법에 따르면, 많은 시도에서 얻은 결과의 평균은 예상 값에 가까워 야하며 더 많은 시도가 수행 될수록 더 가까워지는 경향이 있습니다.

작은 샘플의 결과는 큰 샘플의 결과보다 예상 값보다 더 클 수 있습니다. 따라서 문제에서 언급했듯이 작은 샘플에서 계산 된 결과에주의해야합니다. 아이디어는 이 YouTube 비디오 에서도 잘 설명되어 있습니다.


5
통계에는 "다수의 법칙"으로 알려진 몇 가지 잘 알려진 이론이 있지만, 그 중 어느 것도 문제의 법칙과 같은 진술을하지 않습니다. 그러면 어떻게 연결을 설정합니까?
whuber

3
wikipedia en.wikipedia.org/wiki/Law_of_large_numbers , "법에 따르면, 많은 시행에서 얻은 결과의 평균은 예상 값에 가까워 야하며 더 많은 시행이 수행 될수록 더 가까워지는 경향이 있습니다" . 작은 샘플의 결과는 큰 샘플의 결과보다 예상 값보다 더 클 수 있습니다. 따라서 문제에서 언급했듯이 작은 샘플에서 계산 된 결과에주의해야합니다.
Evan Phibbs

6
좋은 설명입니다. 감사합니다. 법을 신뢰할 수있는 "많은 수의 재판"이 얼마나 필요한지에 대해 신중해야한다고하더라도, 응용 프로그램은 직관적으로 건전합니다. 귀하의 설명이 귀하의 답변에 속한다고 제안하고 싶습니다. 설명이없는 링크 전용 답변 (예 : Youtube 링크)은 여기서 지속되지 않습니다.
whuber

6

우리는 일부 샘플 수량으로 일부 인구 수량을 추정하는 상황에 처해 있습니다. 이 경우 모집단 비율을 추정하기 위해 표본 비율을 사용하지만 그 원리가 훨씬 더 일반적입니다.

10101

더 큰 표본을 추출 할 때 (임의의 표본 추출 사용) 표본 평균은 모집단 평균에 수렴하는 경향이 있습니다. (이것은 많은 법칙입니다.)

그러나 우리가 실제로 알고 싶은 것은 우리가 얼마나 멀리 떨어져 있는지입니다 (예 : 비율에 대한 신뢰 구간의 너비 또는 일반적으로 너비의 절반 인 오차 한계로 표시 될 수 있음) .

120

표본 평균 분포의 표준 편차는 표본 평균과 모집단 평균 간의 거리를 측정하는 한 가지 방법으로 감소합니다 ( 감소 함)1n

결과적으로, 우리는 표본이 클 때 추정치의 정확성에 대해 더 확신합니다. 실험을 다시 반복하면 다른 수단이 현재의 것과 비슷할 것입니다. (이 경우) 우리의 추정치는 편견이 없기 때문에, 우리가 추정하려는 값을 중심으로 함께 모여 있습니다. 단일 표본 평균은 모집단 평균의 위치에 대해 점점 더 많은 정보를 제공합니다.


4

오렌지를 좋아하는 사람의 수를 계산하거나 방사능 붕괴로 인한 가이거 계수기의 "클릭 수"를 계산하는 것과 같은 "계산"통계에 대한 경험의 규칙은 수의 오차 한계가 대략 제곱이라는 것입니다 예상 카운트 값의 루트. 계산 통계는 Poisson 통계라고합니다.

6의 제곱근은 2.4-ish이므로 오차 한계는 약 40 % (2.4 / 6)입니다. 600의 제곱근은 24ish이므로 오차 한계는 약 4 % (24/600)입니다. 이것이 600을 세는 것이 6을 세는 것보다 더 중요한 이유입니다. 상대 오차는 10 분의 1입니다.

오류 마진의 정의에 대해 약간 조잡했습니다. 실제로 1- 시그마 값이며 하드 컷오프는 아니지만 측정의 대부분 (68 %)이 예상되는 범위입니다. 따라서 6 명의 오렌지 먹는 사람을 예상한다면, 6,6,5,6,7,2,4,6,3,5,6과 같이 4-8 개의 범위에서 대부분의 설문 조사를 통해 많은 수의 설문 조사가 나올 것입니다. 6,7,6,10,8,6,5,6,6,9,3,7,8.


3

찾고있는 이름이 없지만 문제는 통계적이지 않습니다. 심리적으로, 두뇌에서 인간이 숫자를 처리하는 방식은 크기 (물리적 크기)가 대표 값만큼 시각적으로 중요하기 때문에 작은 숫자보다 큰 숫자에 더 큰 가중치 (권한)를 부여합니다. 따라서 600/1000은 6/10보다 더 신뢰할 수 있습니다. 이것이 바로 쇼핑객이 "10 % 할인"을 선호하는 이유입니다. 100보다 작은 값과 "10 달러 할인!" 100보다 큰 값 ( "Rule of 100"이라고 함). 우리의 두뇌가 인식에 어떻게 반응하는지에 관한 것입니다.

Nick Kolenda는 온라인 논문에서 " 가격 심리학에 대한 거대한 안내서 "에서 이와 같은 현상에 대한 놀라운 모습을 논의했습니다 .


2
다른 대답은 정확하지 않지만 인용 된 텍스트를 실제로 올바르게 처리하는 것을 볼 수는 없습니다. 이 텍스트는 숫자가 실제로 더 정확한 경우가 아니라 숫자를 제시 할 때의 영향과 인식 된 정확도를 다루고 있습니다. 즉, 1000 또는 60 %의 600을 말함으로써 사용자의 정보가 더 중요하다는 것을 인식하게 할 수 있습니다. 실제로 언급되지 않은 경우, 또는 가능하면 크기.
dlb

1
이 예는 근본적으로 결함으로 보입니다. 예를 들어 100을 구매하면 총 90에 대해 % 10 할인을 받고 100.01을 구매하면 총 75.01에 대해 25를 할인받습니다. 결과적으로 가격이 크게 다릅니다. 실제로 최대 250.05 (반올림 또는 잘림에 따라 250.10)가 될 때까지 값에 차이가 있습니다. 문제는 샘플 크기와 표준 오류에 관한 것이며, 예제는 인식으로 인한 실제 차이에 관한 것입니다.
Joe W

@Jo W, "100의 규칙"(심리학자가 아님)의 구체적인 내용을 말할 수는 없지만, 내 대답은 심리학자들이 사람들이 더 큰 숫자가 아니라 더 큰 숫자를 신뢰하지 않는다고 결정했다는 것입니다 표본 크기를 나타내지 만, 더 큰 숫자가 주어지면 더 큰 중요성을 인식하기 때문입니다. 엔지니어로서 저는이 방식이 아닌 것을 선호합니다.하지만 인간의 마음이 작동하는 방식입니다. 이것에 도전하고 싶다면, Kolenda 씨의 발표에 대한 기본 내용을 읽는 것이 좋습니다.
JBH

당신은 내 요점을 잃어 버렸고, 10에서 100으로 25 %의 더 큰 차이가 있습니다. 그것은 단지 인식의 문제가 아닙니다. 간단한 사실은 두 값을 모두 100으로했다면 15 %의 차이가 있다는 것입니다. 15 %의 차이는 10과 1000 중 하나의 두 개의 서로 다른 샘플을 말할 때 표준 오차보다 훨씬 간단하게 측정 할 수 있습니다.
Joe W

나는 당신을 돕기 위해 10 %와 10 달러를 사용하도록 내 질문을 변경했습니다. "100의 규칙"의 요점은 사람들이 더 큰 숫자를 단순한 백분율보다 더 중요한 것으로 더 큰 관련성과 더 큰 화폐 가치를 갖는 것으로 인식한다는 것입니다. OP의 목적을 위해 논의 범위를 벗어난 문제입니다.
JBH

3

그동안 실제 오차 범위가 중요하며, 그 이유는 소리가 더 설득력이 때문에 사람들과 경험을 더 휴리스틱 (엄지 손가락의 규칙)이다. 실제 오차 한계는이 휴리스틱에 장점이 있음을 확인합니다.

표본이 6 인 경우와 반대 인 4 인 경우 한 사람이 투표를 변경하거나 한 사람이 잘못 기록 된 경우 50/50 일 수 있습니다. 6쪽에 는 사람 만 더 있습니다. 모두는 두 개의 플레이크를 알고, 샘플은 체리 피킹 될 수 있다는 것을 알고 있습니다. 당신은 웨이트리스에게만 물었고 다른 사람은 없었습니다. 또는 대학 홀에서 10 명의 대학 교수 만 설문 조사했습니다. 또는 Saks Fifth Avenue 외부의 부자 10 명에게 물었습니다.

수학적 오류 마진조차도 진정한 임의성을 가정 하고 선택 바이어스 또는 자체 선택 바이어스 또는 기타 다른 것을 고려하지 않으므로 사람들은 직관적으로 이해할 수 있습니다.

반대로 600 대 400 결과는 한쪽에 다른 사람보다 200 명이 더 많으며 100 명이 마음을 바꿔야합니다. 이 숫자는 투표 장소, 사람들의 동의 방법, 개인이 질문을 이해하거나 해석하는 방법 등의 사고로 인해 발생하기가 매우 어렵지만 불가능하지는 않습니다.

그것은 수학적 증거이기 때문에 더 설득력이 있지만, 1000의 군중이 10 그룹보다 의견이 다양 할 가능성이 많은 경험을 통해 알기 때문에 (비밀하게하지 않았다면) 정당 컨벤션 또는 KKK 집회 또는 일방적 인 군중을 끌어들이는 다른 곳에서의 여론 조사).

수학은 직감으로 우리가 이미 알고있는 것을 정확하게 정량화합니다. 1000 개 중 100 개 또는 200 개의 표유 투표를 무작위로 발생하는 것보다 10 개 중 1 개 또는 2 개의 표유 투표를 무작위로 발생시키는 것이 더 쉽다는 점.


3

언급되지 않은 것은 베이지안 관점에서 문제를 보는 것입니다.

베이지안 환경에서이 문제에 대한 자연스러운 접근 방식은 베타-이항 분포 를 사용하는 것 입니다. 사과보다 오렌지를 선호 할 확률이 한다고 가정 할 수 있습니다pp

pBeta(α,β)no|pBin(n,p).

β=αβ=α=1pU(0,1)

nnona=nno

p

p|no,naBeta(no+1,na+1).

pno/(no+na)n

no=6na=4

n_o = 6 및 n_a = 4 인 후방

no=600na=400여기에 이미지 설명을 입력하십시오

p=0.4p=0.8

이 플롯은 david25272와 유사하지만 매우 다른 것을 나타냅니다 .

pno

nop


2

짧은 대답 :

기본적으로 10 개 중 6 개가 임의의 우연히 발생할 가능성이 훨씬 높기 때문에 10 개 중 6 개보다 1000 개 중 600 개를 사용하는 것이 더 설득력이 있습니다 .

오렌지와 사과를 선호하는 비율이 실제로 같다고 가정합니다 (각각 50 %). 이것을 귀무 가설이라고합니다. 이러한 동일한 확률로 두 결과의 가능성은 다음과 같습니다.

  • 10 명의 표본이 주어지면 38 %의 확률 로 오렌지를 선호하는 6 명 이상의 표본을 무작위로 얻을 수 있습니다 (모두 그런 것은 아닙니다).
  • 1000 명으로 구성된 표본의 경우 1000 명 중 600 명 이상이 오렌지를 선호 할 확률이 10 억미만 입니다.

(간단하게하기 위해 무제한의 샘플을 그릴 수있는 무한한 인구를 가정합니다).


간단한 파생

이 결과를 도출하는 한 가지 방법은 사람들이 샘플에서 결합 할 수있는 잠재적 인 방법을 간단히 나열하는 것입니다.

10 명에게는 쉽습니다.

사과 나 오렌지를 선호하는 무한한 인구 집단에서 무작위로 10 명의 표본을 추출하는 것을 고려하십시오. 동일한 환경 설정을 사용하면 10 명의 잠재적 조합을 모두 쉽게 나열 할 수 있습니다.

전체 목록은 다음과 같습니다.

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

r은 결과의 수 (오렌지를 선호하는 사람들)이고, C는 많은 사람들이 오렌지를 선호하는 가능한 방법의 수이며, p는 많은 사람들이 표본에서 오렌지를 선호 할 수있는 이산 확률입니다.

(p는 C를 총 조합 수로 나눈 값입니다.이 두 가지 기본 설정을 총 1024 가지 방법으로 정리할 수 있습니다 (예 : 2에서 10의 거듭 제곱).

  • 예를 들어 10 명 (r = 10)에게는 모두 오렌지를 선호하는 단 하나의 방법 (하나의 샘플) 만 있습니다. 사과를 선호하는 모든 사람들에게도 마찬가지입니다 (r = 0).
  • 10 가지 조합이 있으며 그 중 9 가지가 오렌지를 선호합니다. (한 명의 다른 사람이 각 샘플에서 사과를 선호합니다).
  • 두 사람이 사과 등을 선호하는 45 개의 샘플 (조합)이 있습니다.

(대한 일반적인 우리의 대화에서 C r에 n 개의 결과의 조합이 r에 의 샘플에서 n 개의 사람. 당신이이 번호를 확인하는 데 사용할 수있는 온라인 계산기가 있습니다.)

이리스트를 통해 우리는 단지 나눗셈을 사용하여 위의 확률을 제공 할 수 있습니다. 표본에서 오렌지를 선호하는 6 명을 얻을 확률은 21 %입니다 (조합 중 1024 명 중 210 명). 샘플에 6 명 이상이 들어갈 확률은 38 %입니다 (6 명 이상이있는 모든 샘플의 합계 또는 1024 조합 중 386).

그래픽으로 확률은 다음과 같습니다.

이항 표본 크기 10

숫자가 클수록 잠재적 조합 수가 빠르게 증가합니다.

단지 20 명으로 구성된 표본의 경우 1,048,576 개의 가능한 표본이 있으며 모두 같은 가능성을 갖습니다. (참고 : 아래의 두 번째 조합 만 표시했습니다).

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

20 명 모두가 오렌지를 선호하는 샘플은 여전히 ​​하나뿐입니다. 혼합 된 결과를 특징으로하는 조합은 샘플에있는 사람들을 결합 할 수있는 더 많은 방법이 있기 때문에 훨씬 더 가능성이 높습니다.

편향된 샘플은 그 샘플을 생성 할 수있는 사람들의 조합이 적기 때문에 훨씬 더 가능성이 적습니다.

각 표본에 20 명만 있으면 오렌지를 선호하는 표본에 60 % 이상 (12 명 이상)이있을 확률이 25 %로 떨어집니다.

확률 분포는 더 얇고 커지는 것으로 볼 수 있습니다.

이항 표본 크기 20

1000 명으로 숫자가 엄청나 다

위의 예제를 더 큰 샘플로 확장 할 수 있지만 (모든 조합을 나열하기에는 숫자가 너무 빠르게 커짐) 대신 R의 확률을 계산했습니다.

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

1000 명 중 600 명 이상이 오렌지를 선호 할 확률은 1.364232e-10에 불과합니다.

확률 분포는 이제 중심 주위에 훨씬 더 집중되어 있습니다.

[이항 표본 크기 1000 [3]

(예를 들어, R 사용시 오렌지를 선호하는 1000 명 중 정확히 600 명의 확률을 dbinom(600, 1000, prob=0.5)4.633908e-11로 계산하고 600 명 이상을 확률로 계산하면 1-pbinom(599, 1000, prob=0.5)1.364232e-10 (1 억 미만)입니다.


1

숫자가 높을수록 정확도가 높아지기 때문입니다. 예를 들어, 만약 당신이 지구상의 어느 곳에서나 1000 명의 무작위 사람들을 태우고 그 중 599 명이 6 명의 남자를 가진 10 명의 무작위 사람들에 대해 남자라면, 전자는 더 정확할 것입니다. 마찬가지로 70 억의 인구를 가정하고 남성의 수를 계산하면 1000 명보다 훨씬 더 정확한 수를 얻을 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.