플립의 수가 증가함에 따라 꼬리와 같은 수의 머리를 뒤집을 가능성이 적은 이유를 설명하는 통계 개념?


28

저는 몇 권의 책을 읽고 코드를 작성하여 확률과 통계를 배우고 있습니다. 동전 뒤집기를 시뮬레이션하는 동안 나는 순진한 직관에 약간 반하는 것으로 나타났습니다. 공정한 동전을 번 뒤집 으면 머리와 꼬리의 비율 은 예상 대로 증가함에 따라 1로 수렴 합니다. 그러나 다른 한편으로, 증가함에 따라 꼬리와 같은 수의 머리를 뒤집을 가능성 이 줄어들어 정확히 1 의 비율을 얻습니다 .nnn

예를 들어 (내 프로그램의 일부 출력)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

내 질문은 이것입니다 : 이것을 설명하는 통계 / 확률 이론에 개념 / 원리가 있습니까? 그렇다면 어떤 원칙 / 개념입니까?

내가 이것을 어떻게 생성했는지보고 싶은 사람이 있다면 코드에 연결 하십시오.

-- 편집하다 --

그만한 가치를 위해 여기에 이것을 나 자신에게 설명하는 방법이 있습니다. 공정한 동전을 번 번 머리 수를 기본적으로 임의의 숫자가 생성됩니다. 마찬가지로 같은 일을하고 꼬리를 세면 난수도 생성됩니다. 따라서 둘 다 계산하면 실제로 두 개의 난수를 생성하고 이 커질수록 난수가 커집니다. 그리고 생성하는 난수가 클수록 서로 "누락"할 가능성이 높아집니다. 이 흥미로운 점은 두 숫자가 실제로 어떤 의미로 연결되어 있고, 각 숫자가 분리되어 있어도 비율이 더 커질수록 비율이 1로 수렴한다는 것입니다. 어쩌면 나일지도 모르지만 그런 종류의 깔끔한 것을 발견했습니다.


직관적이거나 수학적인 설명을 원하십니까?
Glen_b-복지 주 모니카

1
둘 다 정말로. 나는 그 이유를 직관적 인 의미 이해 한다고 생각 하지만, 그 이유 뒤에 공식적인 추론을 이해하고 싶습니다.
mindcrime

1
이항 확률을 계산하고이 상황에 적용하는 방법을 알고 있습니까? 그렇지 않다면 찾아보고 계산하십시오.
Mark L. Stone

와우,이 질문에 대한 여러 가지 좋은 답변이 있습니다. 나는 다른 사람이 아니라 하나를 받아 들여야하는 것에 대해 기분이 좋지 않습니다. 모든 답변과 이에 대한 통찰력을 공유하기 위해 시간을내어 주신 모든 분들께 감사드립니다.
mindcrime

답변:


31

헤드 수와 테일 수가 동일한 경우는 "헤드를 정확히 얻을 수있는 시간의 절반"과 같습니다. 따라서 헤드 수를 세어 토스 수의 절반인지 또는 헤드의 비율을 0.5와 동일하게 비교하는지 확인하십시오.

더 많이 뒤집을수록 가능한 수의 헤드 수가 많아집니다. 분포가 더 넓어집니다 (예 : 확률의 95 %를 포함하는 헤드 수의 간격은 토스 수가 증가함에 따라 더 커집니다) 우리가 더 많이 던질수록 정확히 절반의 머리가 나올 확률이 줄어 듭니다.

이에 따라 헤드 비율은 더 많은 가능한 값을 갖습니다. 100 토스에서 200 토스로 이동하는 여기를 참조하십시오.

여기에 이미지 설명을 입력하십시오

100 토스로 우리는 0.49 헤드 또는 0.50 헤드 또는 0.51 헤드의 비율을 관찰 할 수 있지만 (그 값 사이에는 아무것도 없지만) 200 토스로 0.49 또는 0.495 또는 0.50 또는 0.505 또는 0.510을 관찰 할 수 있습니다. 확률은 더 많은 가치를 가짐으로써 각각이 더 작은 점유율을 얻는 경향이 있습니다.

당신이보다 고려 어떤 확률로 토스를 P 나는 점점 내가 (우리가 이러한 확률을 알고 있지만,이 부분에 대한 중요하지의) 머리를, 그리고 당신이 더 토스를 추가합니다. 에서는 2 개 N 토스, N 헤드 가장 가능성있는 결과이다 ( P , N > P N ± 1 및 거기에서 아래로 이동).2pii2nnpn>pn±1

2 n + 2 토스 에서 헤드 를 가질 확률은 얼마입니까?n+12n+2

(이 확률을 와 함께 표시하여 이전과 혼동하지 말고 다음 두 번의 토스에서 P (HH)가 "Head, Head"의 확률이되도록하십시오)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

즉, 두 개의 코인-토스를 더 추가하면 중간 값의 확률이 자연스럽게 줄어 듭니다.

그래서 한 너가 이렇게 편안 피크가 중간에있을 것 (위해 로), 정확히 절반 헤드의 확률이 감소한다 n이 올라갑니다.2n=2,4,6,...n


실제로 우리는 큰 에 대해 p n1에 비례하여 감소 함을 보여줄 수 있습니다.npn (의외로, 표준화 된 헤드 수의 분포가 정규에 접근하고 헤드 비율의 분산이n에따라 감소하기 때문에).1nn


요청에 따라 위의 플롯과 비슷한 것을 생성하는 R 코드가 있습니다.

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

1
나는 그래픽의 1000 단어에 대해 위의 @RustyStatistician과 동의합니다. 코드 포인터에 대한 추가 크레딧.
TomRoche

멋진 인물과 설명!

@Tom 제목에 "200"을 제외하고 모든 것을 수행하는 코드를 포함했습니다.
Glen_b-복지 주 모니카

1
@Glen_b 또 다른 훌륭한 게시물과 코드 라인을 공유하는 관대함에 감사드립니다. 아름다운 음모! 인정하기는 어렵지만 게시물에서 개념의 수학적 표현, 특히 대문자 있습니다. P
Antoni Parellada

1
@Antoni 단지 "두 개의 추가 토스에서 'Head, Head'를 얻을 확률"을 의미합니다. 2n + 2 토스로 n + 1 헤드를 얻으려면 2n 토스로 n-1 헤드 (및 2 헤드 던지기) 또는 n 헤드 (및 1 헤드 던지기) 또는 n + 1 헤드 (및 던지기)가 있어야합니다. 0 헤드). P(HH)
Glen_b-복지 주 모니카

19

큰 숫자법칙은 실험의 첫 번째 결론, 즉 공정한 동전을 번 뒤집 으면 머리와 꼬리의 비율이 n이 증가함에 따라 1로 수렴 한다는 것을 알고 있습니다 . nn

아무 문제가 없습니다. 그러나이 시나리오에서는 모든 대수 법칙에 대해 알려줍니다.

그러나 이제이 문제에 대해보다 직관적으로 생각해보십시오. 동전을 조금씩 뒤집는 것을 고려하십시오 (예 : .n=2,4,8,10

동전을 두 번 뒤집을 때 (즉, ) 두 플립의 가능한 시나리오를 생각해보십시오. 여기서 H 는 머리를, T 는 꼬리를 나타냅니다. 주먹 플립에서 당신은 H 를 얻을 수 있었고 두 번째 플립에서 당신은 T를 얻을 수있었습니다 . 그러나 그것은 두 번의 플립이 일어날 수있는 한 가지 방법입니다. 첫 번째 플립 T 와 두 번째 플립 H 와 다른 모든 가능한 조합에서도 얻을 수 있습니다. 하루가 끝나면 동전 2 개를 뒤집을 때 두 손가락으로 볼 수있는 조합은 S = { H H , H T ,n=2HTHTTH 그리고 n = 2 코인을 뒤집기위한 4 가지 가능한 시나리오가있습니다.

S={HH,HT,TH,TT}
n=2

4 개의 코인을 뒤집 으면 S = { H H H H , H H H T , H H T H , H T H H , T H H H , H H T T 가 될 수있는 가능한 조합의 수 , H T T H , T T H H , T H H T , T H T H , 그리고 n = 4 코인을 뒤집는 시나리오는 16 가지가 있습니다.

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

코인을 뒤집 으면 256 개의 조합으로 이어집니다.n=8

동전을 뒤집 으면 1,024 개의 조합으로 이어집니다.n=10

특히, 숫자 뒤집기 코인 리드 2 개 N 가능한 조합을.n2n

n=2

Pr(Ratio of exactly 1)=24=0.5
n=4
Pr(Ratio of exactly 1)=616=0.375

n

n

Pr(Ratio of exactly 1)0

따라서 귀하의 질문에 대답하십시오. 실제로 당신이 관찰하고있는 것은 머리와 꼬리의 수가 동일한 조합의 수와 비교하여 머리와 꼬리의 수가 동일하지 않은 훨씬 더 많은 동전 플립 조합이 있다는 사실의 결과입니다.



@Mark L. Stone이 제안한 것처럼 이항 수식과 이항 랜덤 변수에 익숙한 경우이를 사용하여 동일한 인수를 표시 할 수 있습니다.

XnXXBin(n,p=0.5)p=0.5

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

n(nn/2)0.5n0n


2
0.5n0n(nn/2)0.5n0n!0.5n0

@Glen_b 게시물에 대해 언급 할만한 충분한 포인트가 없지만 멋진 그래픽입니다!

많은 도움이되는 @RustyStatistician에게 감사드립니다. 설명의 첫 부분은 내가 생각했던 방식과 거의 일치하지만, 통계와 함께 아직 이항 분포를 사용하여 해결하는 방법을 알기에 충분하지 않습니다. 나는 기본적으로 책이나 책을 한 번 읽어 보면서 문제 나 다른 일을하지 않았으며, 이제 처음부터 다시 돌아가서 자료의 다양한 측면을 탐구하는 코드를 작성하고 있습니다.
mindcrime

@mindcrime 좋은 소리! 기꺼이 도와 드리겠습니다.

5

파스칼의 삼각형을 참조하십시오 .

동전 뒤집기 결과의 가능성은 맨 아래 줄의 숫자로 표시됩니다. 같은 머리와 꼬리의 결과는 중간 수입니다. 나무가 커질수록 (즉, 더 많은 플립) 중간 숫자는 맨 아래 줄의 합계의 작은 비율이됩니다.


1

아마도 이것이 아크 사인 법칙과 관련이 있다는 것을 설명하는 데 도움이 될 것입니다. 그것은 말한다위한 하나 개의 결과의 경로 양 또는 음의 영역에서 대부분의 시간에 대한 경로 숙박이 훨씬 높은이 올라가고 것을보다 아래보다 확률 이 직관에 기대 . 다음은 몇 가지 링크입니다.

http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml

https://ko.wikipedia.org/wiki/Arcsine_law


1

머리와 꼬리의 비율은 1로 수렴하지만 가능한 수의 범위는 더 넓어집니다. (나는 숫자를 만들고있다). 100 번의 던지기에 대해 45 %에서 55 %의 헤드를 가질 확률이 90 %라고 가정하십시오. 45 ~ 55 개의 헤드를 얻는 것은 90 %입니다. 헤드 수에 대한 11 가지 가능성. 대략 9 %는 머리와 꼬리 수가 같습니다.

10,000 던에 대해 49 %에서 51 %의 헤드를 얻을 확률이 95 %라고 가정하십시오. 따라서 비율은 1에 훨씬 더 가깝습니다. 그러나 이제 4,900에서 5,100 개의 헤드가 있습니다. 201 가능성. 같은 수의 확률은 약 0.5 %에 불과합니다.

그리고 백만 번의 던지기로 49.9 %에서 50.1 % 사이의 헤드를 확보 할 수 있습니다. 그것은 499,000에서 501,000 헤드의 범위입니다. 2,001 가능성. 기회는 이제 0.05 %로 떨어졌습니다.

자, 수학이 완성되었습니다. 그러나 이것은 "왜"에 대한 아이디어를 제공해야합니다. 비율이 1에 가까워 지더라도 가능성의 수는 더 커지므로 정확히 반 머리, 반 꼬리 를 치는 것이 점점 줄어들게됩니다.

또 다른 실질적인 효과 : 실제로 머리를 던질 확률이 정확히 50 % 인 동전을 가지고있을 가능성은 거의 없습니다 . 정말 좋은 동전을 가지고 있다면 49.99371 % 일 것입니다. 드로우 수가 적더라도 차이가 없습니다. 많은 수의 경우 헤드 비율이 50 %가 아닌 49.99371 %로 수렴됩니다. 던지기 횟수가 충분히 크면 50 % 이상의 머리 던지기는 매우 드물게 진행됩니다.


0

한 가지 주목할 점은 짝수 번의 뒤집기 (동일한 머리와 꼬리 뒤집기의 확률은 물론 정확히 0 임) 일 때 가장 가능성있는 결과는 항상 꼬리가 뒤집히는만큼 머리가 많이 뒤집히는 결과 일 것입니다.

n

(1+엑스2).
그래서 심지어 확률은
=2(/2).

스털링 근사법을 사용하여 !, 당신은 뭔가에 도착

1π/2
정확히 확률 /2 머리 (및 상응하는 꼬리)가 뒤집 힙니다. 전반적인 뒤집기. 따라서이 결과의 절대 확률은 0으로 수렴하지만 다른 결과의 대부분보다 훨씬 느리며 극단적 인 경우 헤드 0 (또는 꼬리 0)이 뒤집 힙니다.2.

2
식에서 수량을 신중하게 정의하여 답을 향상시킬 수 있습니다. 무엇입니까? 무엇입니까?
Sycorax는 Reinstate Monica가

0

동전을 두 번 뒤집 었다고 가정하십시오. HH, HT, TH 및 TT의 네 가지 가능한 결과가 있습니다. 이 중 두 개는 머리와 꼬리 수가 동일하므로 같은 수의 머리와 꼬리를 얻을 확률이 50 %입니다.

이제 동전을 4,306,492,102 번 뒤집어 봅시다. 정확히 2,153,246,051 개의 머리와 2,153,246,051 개의 꼬리 로 50 % 확률로 감칠 수 있습니까?


아니요, 직감에 따르면 숫자가 커져서 정확히 일치 할 가능성이 낮다고 말했습니다. 그러나 나는 단지 내 생각을 확인하기 위해 그것을 시뮬레이션하고 싶었다. 나는 그것이 그런 식으로 밝혀 졌다는 것을 알았을 때, 왜 그런 식인지에 대한 공식적인 추론에 대해 흥미를 느꼈습니다. 이 결과 비율이 수렴되어 흥미 나를 파업 으로 동시에 정확하게 1로 덜되는 동안 1
mindcrime

3
그것에 대해 생각하는 한 가지 방법은 작은 것보다 50-50에 가까운 많은 방법이 있습니다 .
Daniel McLaury
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.