n 번의 토스에서 k 개의 헤드를 관찰합니다. 동전은 공정합니까?


13

인터뷰에서 으로이 질문을 받았습니다 . "올바른"답변이 있습니까?(n,k)=(400,220)

토스가 iid이고 헤드 확률이 가정합니다 . 400 토스에서 헤드 수의 분포는 보통 (200, 10 ^ 2)에 가까워 야 220 헤드가 평균에서 2 표준 편차 떨어져 있습니다. 이러한 결과를 관찰 할 확률 (즉, 어느 방향 으로든 평균에서 2 SD 이상)은 5 %보다 약간 작습니다.p=0.5

면접관은 본질적으로 "평균에서 SD가 2 이상인 것을 관찰하면 다른 일이 진행되고 있다고 결론 내릴 것입니다. 나는 동전이 공정하다는 것에 내기를 걸 것입니다." 그것은 합리적입니다. 결국 대부분의 가설 검정이하는 것입니다. 하지만 그게 끝이야? "정답"인 것처럼 보이는 면접관에게. 내가 여기서 묻는 것은 약간의 뉘앙스가 정당화되는지 여부입니다.

나는 동전이 공평하지 않다고 결정하는 것이이 동전 던지기 상황에서 기괴한 결론이라고 지적 할 수는 없었습니다. 내가 그렇게 말할 수 있습니까? 아래에서 설명해 드리겠습니다.

우선, 저는 대부분의 사람들에게도 동전에 대해 강한 사전 결정권을 가지고 있다고 생각합니다. 물론 그것은 우리가 공정에 의해 의미하는 바에 달려 있습니다. 한 가지 가능성은 "공정"을 "머리가 0.5에 근접 할 확률을 가짐", 즉 0.49와 0.51 사이로 정의하는 것입니다.

(당신은 또한 완벽하게 공정한 동전 지금은 오히려 보이는 경우 필요에, 머리의 확률이 정확히 0.50 인 의미로 '공정'을 정의 할 수 있습니다 않은 것.)

당신의 이전은 동전에 대한 일반적인 신념뿐만 아니라 상황에 달려 있습니다. 자신의 주머니에서 동전을 꺼냈다면 사실상 공평하다고 확신 할 수 있습니다. 마술사 친구가 자신의 물건을 꺼내면 이전에 양면 동전에 더 많은 무게를 넣을 수 있습니다.

어쨌든, (i) 동전이 공정 할 확률이 높고 (ii) 220 머리를 관찰 한 후에도 당신의 후부가 상당히 유사하도록 합리적인 합리적 우선 순위를 쉽게 제시 할 수 있습니다. 그런 다음 평균에서 SD 2 개의 결과를 관찰 했음에도 불구하고 코인이 공정했을 가능성이 높다는 결론을 내 렸습니다.

실제로, 400 번의 토스에서 220 개의 헤드를 관찰 하는 것이 예를 들어, 모든 불공정 한 코인이 에 헤드의 확률을 갖는 경우, 후방 이 코인의 공정에 더 많은 가중치를 부여하는 예를 구성 할 수 있습니다 .{0,1}

누구든지 나를 위해 이것에 대해 약간의 빛을 비출 수 있습니까?


이 질문을 쓴 후에 나는이 일반적인 상황에 대해 들어 본 적이 있다는 것을 기억했다. 린들리의 "역설"이 아닌가?

Whuber는 주석에 매우 흥미로운 링크를 넣었습니다. 다이를로드 할 수는 있지만 동전을 바이어스 할 수는 없습니다 . 3 페이지부터 :

동전이 머리를 던질 확률이 있다고 말하는 것은 말이되지 않습니다. 동전이 빠른 회전으로 공중에서 던지고 공중에서 잡히지 않는 한 동전이 던져지는 방식에 의해 완전히 결정될 수 있기 때문입니다. 수신 거부 없음 (이 경우 p = 1/2)

정말 멋진! 이것은 흥미로운 방법으로 제 질문에 연결됩니다. 동전이 "빠른 회전으로 공중에서 높이 던져지고 튀지 않고 공중에 갇히고있다"고 가정합니다. 그런 다음 우리는 동전이 공정하다는 가설을 분명히 거부해서는 안됩니다 ( "공정"은 이제 "위에 설명 된 방식으로 던질 때 p = 1 / 2가 발생 함"을 의미합니다). 공정한 동전. 어쩌면 220 머리가 관찰 된 후 null을 거부하는 것이 불편한 이유를 어느 정도 정당화 할 수 있습니다.


1
"코인"을 사전 지식이없는 이진 프로세스에 대한 은유로 해석하면 질문의 일부가 변경됩니까?
whuber

1
@ whuber 좋은 질문입니다. 이 경우에는 "p <= 0.05 일 때 거부"를 사용하여 훨씬 더 기꺼이 기꺼이 생각할 것입니다.
Adrian

나를 귀찮게하는 또 다른 문제는 질문을하는 사람이 p = 0.50이라는 가설에 관심이 있다는 것입니다. 그러나 p가 지속적으로 분포된다고 생각하면 관찰 한 것과 상관없이 확률이 0이됩니다. p에 대해 어떤 간격에 속하는 것에 대해 진술하는 것이 훨씬 더 의미가 있습니다. 예를 들어 사전 지식이 없었고 균일 한 유니폼을 사용하기로 결정한 상황에서 이것은 문제가 될 것입니다.
Adrian

3
말이 되는군요. 그러나 이러한 질문에 대한 답은 일반적으로 동전 뒤집기의 물리학 (그리고 손에 맞지 않는)에 대한 토론으로 이어지기 때문에 동전 중심의 질문은 약간 산만합니다. 동전이 뒤집히는 방법 에 따라 실제 상황이 강한 사전에 얼마나 반대되는지 충격을받을 수 있습니다 . "동전이 의 확률 p 를 갖는다 고 말하는 것은 의미가 없다 "p .
whuber

1
@Adrian DJC MacKay는 그의 무료 교과서 에서이 정확한 문제 (n = 250, k = 140)에 대해이 링크에서 논의합니다 : inference.phy.cam.ac.uk/itprnn/book.pdf (p63.) 그가 말하는 것을 읽으십시오. 그는 당신에게 비슷한 결론에 도달합니다.
Flounderer

답변:


4

이 문제를 해결하는 표준 베이지안 방법 (일반 근사치 제외)은 사전을 명시 적으로 말하고 베타 분포 인 가능성과 결합하는 것입니다. 그런 다음 후방을 약 50 % 정도 통합하고 두 가지 표준 편차 또는 49 % – 51 % 또는 원하는 것을 말합니다.

예를 들어 Beta (100,100)와 같이 [0,1]에 대해 이전의 믿음이 지속된다면 (이것은 대략 공정한 동전에 많은 양을 넣습니다) – 가능성도 연속적이므로 동전이 공정 할 확률은 0입니다 [0 , 1].

동전이 공평 할 확률이 0이더라도 일반적으로 편향보다 사후에 답할 질문에 대답 할 수 있습니다. 예를 들어, 동전 확률에 대한 사후 분포를 고려할 때 카지노의 우위는 무엇입니까?


1
0.49<p<0.5199%pBeta(8300,8300)
P(p(0.49,0.51))=0.99003.
p|dataBeta(8300+220,8300+180)
P(p(0.49,0.51)|data)=0.9886.

2

Bernoulli Distribution,이 경우 동전 던지기를 가정 해 봅시다.

B(n=400,p=0.5)N(μ=200,σ2=100)

k95%B(n=400,p=0.5)pB(n=400,p=0.5,k=220)

p=0.5π(p=0.5)=0.5π(p0.5)=0.5

π(0.49p0.51)=0.9π(p<0.49p>0.51)=0.1p

P(0.49p0.51|k=220)

pN(μ=0.5,σ2=0.25)σ2=0.1

pf(p|k=220)


내 평판은 질문 아래에 의견을 작성하기에 충분하지 않습니다. 대신 당신은 동전을 바이어스 할 수없는 것에 대해 뭔가를 쓸 것 입니다. @ 아드리안

우리가 가진 것입니다

  1. B(n=400,k=220,p=θ)
  2. 동전을 편견 할 수없는 이론 및 실험 연구

여기에 우리의 가설이 있습니다

H0:θ^=0.5

H1

결과는 다음과 같습니다

  1. H0
  2. H1

pH0H1

그렇지 않으면 여기서 가설 검정에 대한 이중 표준을 만듭니다. 우리는 동전 던지기가 공정 하고 실험 데이터가 올바르게 기록 되었다는 가설을 받아 들일 수 없습니다 .


동전에 p의 확률 p가 있다고 말하는 것은 의미가 없습니다.

이 가설을 뒷받침하는 실험 결과가 있습니다.

pN(μ=0.5,σ2)

σs


1
장 감사합니다. 하나의 작은 니트 : 머리 확률보다 이전에 정규 분포를 사용하려면 p가 [0, 1]에 있도록 잘라야한다고 말하고 싶습니다.
Adrian

물론 합리적인 사전 분포와 그에 따른 후부가 많이 있습니다. 내 질문의 진정한 요점은 더 일반적입니다. 동전이 불공평하다는 결정은이 동전 던지기 상황에서 기괴한 결론 인 것 같습니다. 당신은 그것에 대해 어떻게 생각하십니까?
Adrian

베타 분포는 이항 우도에 결합하기 때문에 베타 배포가 편리합니다. 그러나 다시, 내 질문의 실제 추력은 특정 이전보다 더 일반적입니다.
Adrian

π(p=0.5)pU(0,1)E(p)f(p|k=220)p=0.5E(p). 그리고 우리는 동전이 불공평하다는 가설을 쉽게 받아들입니다. 특히이 경우 동전을 기괴한 결론으로 ​​간주하지 않는 것이 아닙니다.
Zhang Tschao 2

@ user777 정규 분포는 장의 반응에서 두 번 나타납니다. 먼저 이항에 대한 근사값 (대)으로, 두 번째로 머리 확률 (이전은 정규 분포 p ~ N이라고 함)에 대한 사전으로 나타납니다. Zhang- "코인이 공정하고 데이터가 올바르게 기록되었습니다"라는 Null에 대한 편집 내용이 흥미 롭습니다. 게시 해 주셔서 감사합니다.
Adrian
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.