여아 대 남아 출생의 예상 비율


45

나는 비판적 사고에 대한 면접 적성 검사에서 질문을 보았습니다. 다음과 같이 진행됩니다.

조간 공화국에는 매우 이상한 관습이 있습니다. 부부는 여성 만이 가족의 부를 물려받을 수 있기 때문에 여성 자녀 만 갖고 싶어합니다. 따라서 남자 아이가 있으면 여자 아이가 생길 때까지 더 많은 아이를 갖게됩니다. 소녀가 있으면 아이를 낳지 않습니다. Zorgania에서 소녀 대 소년의 비율은 얼마입니까?

질문 작성자가 제시 한 모델 답변 (약 1 : 1)에 동의하지 않습니다. 정당화는 모든 출생이 항상 남성 또는 여성 일 확률이 50 %라는 것이다.

가 소녀의 수이고 B가 전국의 소년 수인 경우 대해보다 수학적으로 활발한 답변을 수 있습니까?GE[G]:E[B]G


3
M : F의 출생 비율이 어린이의 M : F 비율과 다르기 때문에 모델 답변에 동의하지 않습니다. 실제 인간 사회에서 여자 아이 만 갖고 싶어하는 부부는 남자 아이를 제거하기 위해 유아 살해 또는 외국 입양과 같은 수단을 사용하여 1 : 1 미만의 M : F 비율을 초래할 것입니다.
Gabe

10
@ 가베 문제에 살충제에 대한 언급은 없으며 살인이 흔한 실제 국가에 대한 거친 분석과는 달리 수학적 운동입니다. 마찬가지로 남학생과 여학생의 출생 비율은 51:49에 가깝습니다 (사회적 요인 무시)
Richard Tingle

2
답변 덕분에 나는 왜 비율이 1 : 1인지 이해합니다. 나의 불신과 혼란에 대한 이유 중 하나는, 중국의 마을들이 남자 : 소녀 비율이 너무 높다는 반대의 문제가 있다는 것을 알고 있습니다. 현실적으로 부부는 그들이 원하는 아이의 성별을 얻을 때까지 무기한으로 번식 할 수 없다는 것을 알 수 있습니다. 중국에서는 법에 따라 농촌 지역에 사는 사람들에게 최대 2 명의 어린이 만 허용되므로이 경우 비율은 1 : 1보다 3 : 2에 가깝습니다.
Mobius Pizza

4
@MobiusPizza : 아니요, 자녀 수에 관계없이 비율은 1 : 1입니다! 중국의 비율이 다른 이유는 유아 살해, 성 선택 낙태 및 외국 입양과 같은 사회적 요인 때문입니다.
Gabe

3
@newmount 시뮬레이션은 훌륭하지만 내장 된 가정만큼이나 의미가 있습니다. 설명없이 코드 만 표시하면 사람들이 이러한 가정을 식별하기가 어렵습니다. 그러한 타당성과 설명이 없다면, 시뮬레이션 결과의 양이 여기에서 문제를 해결하지 못할 것입니다. "실제 세계"가 진행되는 한, 그러한 주장을하는 사람은 누구나 사람의 출생에 관한 데이터로이를지지해야합니다.
whuber

답변:


46

자녀없이 시작

단계를 반복

{

여전히 자녀가있는 모든 부부에게는 자녀가 있습니다. 부부의 반은 수컷이고 부부의 반은 암컷입니다.

암컷이있는 커플은 아이를 낳지 않습니다

}

각 단계마다 짝수의 남성과 여성이 있으며, 자녀가있는 부부의 수는 절반으로 줄어 듭니다 (즉, 여성이있는 부부는 다음 단계에서 자녀가 없음)

따라서, 주어진 시간에 당신은 같은 수의 남성과 여성을 가지고 있으며, 단계적으로 단계적으로 자녀를 둔 부부의 수는 절반으로 떨어집니다. 더 많은 부부가 만들어지면서 같은 상황이 반복되고 다른 모든 것들이 동일 해지면 인구는 같은 수의 남녀를 포함하게됩니다


6
나는 이것이 엄밀한 수학적 증거에 의존하지 않고 확률 분포를 설명하는 훌륭한 방법이라고 생각합니다.
LBushkin

1
내가 좋아하는 것은 이것은 또한 직관이 기대하는 초과 소녀들에게 일어난 일을 설명한다는 것입니다. 초과 소녀는 부모 가 하지만 (다시 시도하는 부모님) 부모는 (전체적으로) 여자애들.
벤 잭슨

2
"반복 단계 {누군가가 아이를 낳을 지 여부를 결정}"으로 말하면 훨씬 더 단순화 할 수 있습니다. 그들이 결정하는 규칙은 모두가 같은 확률로 남자와 여자를 독립적으로 생산한다면 완전히 무관합니다. 그 확률에 대한 값을 가정 할 필요조차 없습니다. 인구의 빈도가 출생 빈도와 동일하다고 말할 수 있습니다.
Steve Jessop

1
@martino 나는 이것이 사실이라고 생각하지는 않지만이 효과에 대해 매우 설득력있는 수학이 있었더라도 놀라지 않을 것입니다. 이 시나리오는 가족당 예상되는 어린이 수가 무한하기 때문에 비율 개념이 무너질 것이라고 생각합니다. 이 스레드에서 사람들이 귀하의 질문에 답변 한 일반성 때문에 귀하의 답변에 회의적이어야합니다.
jlimahaverford

1
@ 마 티노. 재미를 위해 나는 그 정지 기준으로 시뮬레이션을 실행했습니다. 10,000 가족은 0.9999377735896915의 비율로 총 160,693,469 명의 소년 (및 그 수에 10,000 더 많은 소녀)이있었습니다. 꽤 놀라운 것들.
jlimahaverford

37

가족의 소년 수라고 합시다 . 여자 아이가 생기 자마자 멈춰요X

X=0if the first child was a girlX=1if the first child was a boy and the second was a girlX=2if the first two children were boys and the third was a girland so on

경우 아이가 아이가 있음과 성별 아이들과 무관 한 경우, 확률이 갖는 최대 가족 끝나는 확률 아이가 즉 명의 소년이 있고 소녀가 있을 확률 . 예상 번호 소년은 것을주의 우리 얻을 k P ( X = k ) = p k( 1 p ) , k E X = k = 0 k p k( 1 p ) = k = 0 k p k - k = 0 K에서 P는 K + 1 . k =pk

P(X=k)=pk(1p),
k
EX=k=0kpk(1p)=k=0kpkk=0kpk+1.
k = 0 kpk k = 0 kp k + 1 = k = 0 (k+1)p k + 1 k = 0 kp
k=0kpk=k=0(k+1)pk+1
k = 0 pk=1/(1p)0<p<1
k=0kpkk=0kpk+1=k=0(k+1)pk+1k=0kpk+1=k=0pk+1=pk=0pk=p1p
여기서 우리는 때 ( 기하학적 시리즈 참조 ).k=0pk=1/(1p)0<p<1

인 경우 입니다. 즉, 평균 가족은 1 명의 소년이 있습니다. 우리는 이미 모든 가정에 1 명의 소녀가 있다는 것을 알고 있으므로 시간이 지남에 따라 입니다.E X = 0.5 / 0.5 ~ 1 / 1 = 1p=1/2EX=0.5/0.51/1=1

랜덤 변수 는 기하 랜덤 변수라고 합니다.X


4
물론 이것은 모든 가정에서 동일 하다고 가정 합니다 p. 대신에 우리는 일부 커플이 다른 커플보다 남자 아이를 가질 가능성이 더 높다고 가정하면 ( , p더 높음) 평균값p 이 여전히 0.5 인 경우에도 결과가 변경 됩니다. (이것은 기본 통계에 대한 훌륭한 설명입니다.)
Ben Hocking

2
@Ben 댓글에 핵심 아이디어가 포함되어 있습니다. 나에게도 똑같은 일이 발생했기 때문에 더 현실적인 상황에 대한 분석을 포함하도록 내 질문을 편집했습니다. 제한 비율이 반드시 1 : 1 일 필요 는 없음을 보여준다 .
whuber

1
@BenHocking 참으로! 그리고 현대 통계와 Laplace의 고전적인 출생 비율 분석에서 알 수 있듯이 는 실제로 과 같지 않습니다 . :)1 / 2p1/2
MånsT

21

요약

모든 출생이 독립적으로 소녀가 될 확률이 50 %라는 간단한 모델은 비현실적이고 예외적입니다. 모집단 간의 결과 변동에 따른 결과를 고려하자마자, 소녀 대 소년의 비율은 1 : 1을 초과하지 않는 모든 값 이 될 수 있습니다 . (실제로는 여전히 1 : 1에 가깝지만 데이터 분석이 결정해야하는 문제입니다.)

이 두 가지 상충되는 답변은 출생 결과의 통계적 독립성을 가정함으로써 얻어 지므로 독립에 대한 호소는 불충분 한 설명입니다. 따라서 (여성 출생의 가능성에서) 변이 가 역설의 핵심 아이디어 인 것으로 보인다.

소개

역설은 우리가 무언가를 믿을만한 충분한 이유가 있다고 생각할 때 발생하지만 그 반대에 대한 확고한 주장에 직면합니다.

역설에 대한 만족스러운 해결책은 우리가 옳은 것과 두 가지 논쟁 에 대해 무엇이 잘못되었는지를 이해하는 데 도움이됩니다 . 확률과 통계에서 종종 그렇듯이 두 가지 주장 모두 실제로 유효 할 수 있습니다. 해결책 은 내재적으로 가정 된 가정 간의 차이에 달려 있습니다. 이러한 다른 가정을 비교하면 상황의 어떤 측면이 다른 답변으로 이어지는지를 식별하는 데 도움이 될 수 있습니다. 이러한 측면을 파악하는 것이 가장 중요하게 생각합니다.

가정

지금까지 게시 된 모든 답변에서 알 수 있듯이, 여성 출생은 독립적 으로 지속적 으로 확률 로 발생한다고 가정하는 것이 당연합니다 . 어느 가정도 실제로 사실이 아니라는 것은 잘 알려져 있지만, 이러한 가정과의 약간의 편차는 대답에 큰 영향을 미치지 않는 것으로 보입니다. 우리에게 보여줘. 이를 위해 다음과 같은보다 일반적이고 현실적인 모델을 고려하십시오.1/2

  1. 각 가정에서 여성 출생 확률 상수 없이 출생 순서.ipi

  2. 중지 규칙이 없으면 인구에서 예상되는 여성 출생 수는 예상되는 남성 출생 수에 근접해야합니다.

  3. 모든 출생 결과는 (통계적으로) 독립적입니다.

이것은 가 부모 (특히 어머니)의 나이에 따라 달라질 수 있는 완전히 현실적인 인간 출생 모델이 아닙니다 . 그러나보다 일반적인 모델에 적용 할 역설의 만족스러운 해상도를 제공하는 것은 충분히 현실적이고 유연합니다.pi

분석

이 모델을 철저히 분석하는 것은 흥미롭지 만, 구체적이고 단순한 (그러나 다소 극단적 인) 버전을 고려하더라도 주요 요점은 분명해집니다. 인구에 가족 이 있다고 가정하십시오 . 이 중 절반에서 여성의 출생 확률은 이고 다른 절반에서 여성의 출생 확률은 입니다. 이것은 명백하게 조건을 만족시킨다 (2) : 예상되는 여성 및 남성 출생의 수는 동일하다.2N2/31/3

그 첫 가족을 고려하십시오 . 실제 결과가 임의적이므로 예상과 약간 다를 수 있다는 점을 이해하면서 기대의 관점에서 추론합시다. (다음 분석의 배후에있는 아이디어는이 게시물의 끝에 나오는 원래의 답변으로 더 간단하고 간단하게 전달되었습니다.)N

일정한 여성 출생 확률 갖는 모집단에서 가 예상되는 여성 출생 수라고 하자 . 분명히 이것은 비례 하므로 이라고 쓸 수 있습니다 . 유사하게, 이 예상되는 남성 출산 수 라고하자 .f(N,p)NpNf(N,p)=f(p)Nm(p)N

  • 첫 번째 가족은 소녀를 생산하고 멈 춥니 다. 다른 가족은 소년을 낳고 계속해서 아이를 낳습니다. 그건 소녀 지금까지 소년.pN(1p)NpN(1p)N

  • 나머지 가족은 이전과 같은 위치에 있습니다.(1p)N 독립 가정 (3)은 장래에 경험하는 것이 장남이 아들이라는 사실에 영향을받지 않음을 의미합니다. 따라서, 이들 가족은 더 많은 소녀와 더 많은 소년 을 생산할 것 입니다.f(p)[(1p)N]m(p)[(1p)N]

총 여아와 남학생을 합산하고 과 의 가정 된 값과 비교 하면 방정식이 제공됩니다.f(p)Nm(p)N

f(p)N=pN+f(p)(1p)N  and  m(p)N=(1p)N+m(p)(1p)N

솔루션으로

f(p)=1  and  m(p)=1p1.

인 첫 번째 가족 의 예상 소녀 수는 이고 예상 소년 수는 입니다.Np=2/3f(2/3)N=Nm(2/3)N=N/2

인 두 번째 패밀리 의 예상 소녀 수는 이고 예상 소년 수는 입니다.Np=1/3f(1/3)N=Nm(1/3)N=2N

총계는 소녀와 소년입니다. 큰 경우 기대 비율은 기대 비율에 가깝습니다.(1+1)N=2N(1/2+2)N=(5/2)NN

E(# girls# boys)2N(5/2)N=45.

그만두는 규칙은 소년들에게 유리합니다!

보다 일반적으로 확률 와 독립적으로 소녀를 낳는 가족의 절반과 확률 독립적으로 소년을 낳는 가족의 절반으로 조건 (1) ~ (3)이 계속 적용되고 큰 접근에 대한 예상 비율p1pN

2p(1p)12p(1p).

에 따라 사이 코스 거짓말하는 과 ,이 값이 될 수 있습니다 어디서나 사이의 과 (그러나 결코 어떤보다 큰 ). 경우에만 최대 값이 입니다. 다시 말해, 1 : 1의 예상 소녀 대 소년 비율은 첫 번째 소녀와 함께 멈추는 것이 더 많은 소년들에게 유리하다는 더 일반적이고 현실적인 규칙에 대한 특별한 예외입니다.p010111p=1/2

해결

첫 번째 소녀와 함께 멈추는 것이 인구에서 더 많은 소년을 생산 해야 한다는 직감이 있다면 이 예에서 볼 수 있듯이 맞습니다. 올바른 것을 얻으려면 소녀를 낳을 확률은 가족마다 (아마도 조금씩) 다릅니다.

비율이 1 : 1에 가까워 야한다는 "공식적인"대답은 몇 가지 비현실적인 가정을 필요로하며 이들에 민감합니다. 가족간에 차이가없고 모든 출생이 독립적이어야한다고 가정합니다.

코멘트

이 분석에서 강조된 핵심 아이디어 는 모집단 내의 변동이 중요한 결과를 초래 한다는 것입니다. 출생의 독립성은 (이 스레드의 모든 분석에 사용되는 단순화 된 가정 임에도 불구하고) 역설을 해결 하지 않습니다 . 왜냐하면 다른 가정에 따라 공식적인 대답과 그 반대와도 일치하기 때문입니다.

그러나 예상 비율이 실질적으로 1 : 1에서 출발 하려면 모집단 의 간에 많은 변화 가 필요합니다 . 모든 가 0.45와 0.55 사이라면,이 변화의 영향은 눈에 띄지 않을 것입니다. 실제로 사람 인구 에 있는지에 대한이 질문을 해결 하려면 상당히 크고 정확한 데이터 세트가 필요합니다. 일반화 된 선형 혼합 모델을 사용 하고과 분산을 테스트 할 수 있습니다 .pipipi

성별을 다른 유전자 발현으로 대체하면 자연 선택에 대한 간단한 통계적 설명을 얻을 수 있습니다. 유전자 구성에 따라 자손의 수를 차등 적으로 제한하는 규칙은 다음 세대에서 유전자의 비율을 체계적으로 변경할 수 있습니다. 유전자가 성적으로 연결되어 있지 않으면, 작은 효과조차도 연속적인 세대를 통해 곱셈으로 전파되어 빠르게 확대 될 수 있습니다.


원래 답변

각 어린이에게는 출생 순서가 있습니다 : 첫째, 둘째, 등.

남성과 여성의 출생 확률이 같고 성별간에 상관 관계가 없다고 가정 할 때, 다수의 약한 법칙은 첫 번째 여성과 남성의 비율이 1 : 1에 가깝다고 주장 합니다. 같은 이유로 두 번째로 태어난 여성과 남성의 비율은 1 : 1에 가깝습니다. 이러한 비율은 지속적으로 1 : 1이므로 출생 순서의 상대적 빈도가 인구에 어떤 영향을 미치는지에 관계없이 전체 비율도 1 : 1이어야합니다.


흥미있는; 규칙이 자연 비율에서 비율을 변경할 수는 없지만 결과 어린이 수를 변경할 수 있으며 해당 어린이 수는 자연 비율에 따라 달라지기 때문입니다. 예를 들어, 부모의 두 집단이 있고 그들은 다르게 영향을받습니다. (이것은 이것이 수학적 운동 인 암시 적 허구 국가의 범위를 벗어난 상황처럼 느껴진다)
Richard Tingle

@Richard 박람회를 위해 너무 단순화했기 때문에 그런 느낌이들 것입니다. 실제로 는 평균이 인 분포로 모집단을 모델링합니다 . 해당 분포의 분산이 0이 아닌 한 동일한 분석은 예상되는 소녀 대 소년의 비율이 엄격히 보다 작다는 것을 포함하여 동일한 결론을 내포합니다 . 이것은 일반적인 결론 (비율이 1 : 1이어야 함)이 변하지 않는 가정에 달려 있다는 것을 보여줍니다. 수학을 사용하여 이것에 대해 추론 한 것에 대해 사과하지는 않을 것입니다. 결과에 대한 관심은 줄어들지 않습니다. pi1/21
whuber

1
당신이 사과하지 않아도, 이것은 매우 흥미로운 결과입니다 (내가 그것을 읽을 때 실제로 와우라고 생각했습니다). "원래 결과", "보다 현실적인 상황"형식으로 선호합니다. "남성 출산이 더 흔하기 때문에 1 : 1이 아니라는 것은 분명합니다."(우리의 역사적 세속으로 인해 믿습니다)
Richard Tingle

@Richard 좋은 지적입니다. 나는 게시물이 너무 길었기 때문에 의 평균 을 약 (무장 전투와 관련이 없음 : 생물학적 설명이 있음) 로 변경하는 것과 같이보다 현실적인 버전의 질문을 논의하지 않았습니다 . 이 방법을 일반화하는 방법이 명확해야합니다. 나는 역설해결하는 데 초점을 맞추기를 원한다 . 역설해결하는 것이 바람직하다 . 이것은 여러 가지 겉보기에 유효한 답 사이의 명백한 갈등을 분명히하고 설명하는 자연적이지만 간과되는 메커니즘을 찾는 것이다. pi0.51
whuber

유익한 답변 감사합니다. 계산에서 왜 소녀를 낳을 확률이 다른 두 가족으로 인구를 나누는 이유를 모르겠습니다. 모형 가정의 포인트 1에 따르면 p_i는 모든 패밀리에서 동일해야합니다. 그렇다면 왜 인구를 두 종류의 가족으로 나누었습니까?
Mobius Pizza

14

각 어린이의 출생은 소년의 경우 P = 0.5, 여자의 경우 P = 0.5 인 독립적 인 행사 입니다. 다른 세부 사항 (가족 결정과 같은)은이 사실에서 벗어나기 만합니다. 그러므로 그 비율은 1 : 1이라는 것 입니다.

이것에 대해 설명하자면 : 아이를 갖지 말고 "머리"를 얻을 때까지 공정한 동전 (P (heads) = 0.5)을 뒤집는다고 상상해보십시오. Family A가 동전을 뒤집어 놓고 [꼬리, 꼬리, 머리]의 순서를 얻는다고 가정 해 봅시다. 그런 다음 가족 B는 동전을 뒤집고 꼬리를 얻습니다. 자, 다음이 머리가 될 확률은 얼마입니까? 그것은 독립적 인 의미 이기 때문에 여전히 0.5 입니다. 1000 개의 패밀리 (1000 개의 헤드가 나옴)로이 작업을 수행하는 경우 각 플립 (이벤트)이 완전히 독립적이기 때문에 예상되는 총 테일 수는 1000입니다.

패밀리 내 시퀀스와 같은 일부 사물은 독립적 이지 않습니다 . 시퀀스 [머리, 머리]의 확률은 0이며 [꼬리, 꼬리] (0.25)와 같지 않습니다. 그러나 질문은 이것에 대해 묻지 않기 때문에 관련이 없습니다.


3
명시된 바와 같이, 이것은 올바르지 않습니다. 성별이 무조건 독립적 이라면, 장기적으로 소년 소년 순서가있는 것처럼 가족들 사이에서 출생시 많은 소녀-소녀 시퀀스가있을 것입니다. 후자는 많지만 전자는 없습니다 . 독립의 형태가 있지만 출생 순서에 따라 조건 이 다릅니다.
whuber

1
@whuber 우리는 얼마나 많은 소녀-소녀 시퀀스가 ​​있는지 묻지 않았습니다. 소녀 대 소년의 비율. 나는 개별 어머니의 출생 순서가 동전 뒤집기와 같은 일련의 독립적 인 사건이라고 말하지 않았습니다. 각 출생은 개별적으로 독립적 인 행사입니다.
Tim S.

당신은 그것에 대해 훨씬 명확해야합니다. 나는 독립성이 결여되어 있음을 증명하기 위해이 순서를 언급 했으므로 여기서 "독립성"이 적용되는 엄격한 의미로 부담해야 할 부담이 있습니다.
whuber

@whuber 이벤트는 코인 플립과 같은 방식으로 독립적 입니다. 나는 이것에 대해 대답했다.
Tim S.

3
@whuber 당신이 모든 출생을 한 줄에 넣으면 소녀-소녀 시퀀스가 ​​나타납니다. 한 부부가 다음을 마치고 나면 등
Richard Tingle

6

머리를 볼 때까지 공정한 동전을 던지는 것을 상상해보십시오. 얼마나 많은 꼬리를 던지나요?

P(0 tails)=12,P(1 tail)=(12)2,P(2 tails)=(12)3,...

예상 꼬리 수는 1로 쉽게 계산됩니다 *.

헤드 수는 항상 1입니다.

* 이것이 확실하지 않은 경우 여기에서 '증명서 개요'를 참조 하십시오.


6

정확히 한 여자와 남자가없는 커플이 가장 일반적입니다

이 모든 것이 해결되는 이유는 소녀가 더 많은 시나리오가 소년이 더 많은 시나리오보다 훨씬 크기 때문입니다. 그리고 소년이 더 많은 시나리오는 확률이 매우 낮습니다. 그 자체로 작동하는 구체적인 방법은 다음과 같습니다.

NumberOfChilden Probability  Girls   Boys  
1               0.5           1       0  
2               0.25          1       1  
3               0.125         1       2  
4               0.0625        1       3  
...             ...           ...     ...  

NumberOfChilden Probability   Girls*probabilty   Boys*probabilty 
1               0.5           0.5                0
2               0.25          0.25               0.25
3               0.125         0.125              0.25
4               0.0625        0.0625             0.1875
5               0.03125       0.03125            0.125
...             ...           ...                ...  
n               1/2^n         1/(2^n)            (n-1)/(2^n)

이 시점에서 이것이 어디로 가고 있는지 거의 알 수 있습니다. 소녀와 소년 모두 합쳐질 것입니다.

한 커플의 예상 소녀 한 커플의 예상 소년=n=1(12n)=1
=n=1(n1n2)=1

Wolfram의 솔루션 제한

어떤 출생이든, 어떤 가족이든 소년이나 소녀 일 확률은 50:50입니다

(모두가 시도 할 수 있음) 특정 출생이 소년 또는 소녀 일 확률을 제어 할 수 없기 때문에 이것은 모두 본질적으로 의미가 있습니다. 아이가없는 부부 나 백 소년의 가족에게서 태어 났는지 여부는 중요하지 않습니다. 기회는 50:50입니다. 따라서 각각의 출생시 50:50의 기회가 있다면 항상 반반 씩 소녀와 반반 씩을 받아야합니다. 그리고 가족들 사이의 출생을 어떻게 뒤섞을지는 중요하지 않습니다. 당신은 그것에 영향을 미치지 않습니다.

이것은 모든 1 규칙에 적용됩니다

출생시 50:50의 기회로 인해 비율은 (합리적인 1 ) 규칙에 대해 1 : 1로 끝납니다 . 예를 들어 아래의 비슷한 규칙도

부부는 소녀가있을 때 아이를 낳지 않거나 두 아이를 낳습니다

NumberOfChilden Probability   Girls   Boys
1               0.5           1       0
2               0.25          1       1
2               0.25          0       2

이 경우 총 예상 자녀 수를보다 쉽게 ​​계산할 수 있습니다.

한 커플의 예상 소녀 한 커플의 예상 소년=0.51+0.251=0.75
=0.251+0.252=0.75

1 내가 말했듯이 이것은 현실 세계에 존재할 수있는 합리적인 규칙에 적용됩니다. 불합리한 규칙은 커플당 예상되는 자녀 수가 무한한 규칙입니다. 예를 들어 "부모는 소녀보다 두 배나 많은 소년이있을 때만 자녀를 낳지 않습니다"와 같이 위와 같은 기술을 사용하여이 규칙에 따라 무한한 자녀가 생길 수 있습니다.

NumberOfChilden Probability   Girls   Boys
3               0.125         1       2
6               1/64          2       4
9               1/512         3       6
3*m             1/((3m)^2     m       2m

그런 다음 유한 한 자녀 수를 가진 부모의 수를 찾을 수 있습니다

유한 한 자녀가있는 부모의 예상 수=m=1(11/(3m)2)=π254=0.18277.

Wolfram의 솔루션 제한

그래서 우리는 부모의 82 %가 무한한 수의 자녀를 갖게 될 것임을 확신 할 수 있습니다. 도시 계획의 관점에서 볼 때 이것은 아마도 어려움을 야기 할 것이며 실제 환경에서는이 조건이 존재할 수 없음을 보여줍니다.


3
출생 순서를 조사함으로써 독립성이 없다는 것은 명백합니다. 소년-소년 서열이 자주 나타나는 동안 소녀-소녀는 나타나지 않습니다.
whuber

1
@ whuber 나는 당신의 요점을 본다. 과거의 모든 출생에서 "
Richard Tingle

그렇습니다. 저는 여기에서 독립 사용을 구출 할 방법이 있다고 생각합니다. 그러나 이것은 문제의 중심에 있다고 생각합니다. 따라서 OP에 대한 "강력한"시연에 대한 OP의 요청을 존중하기 위해서는이 문제에 대한 신중한 추론이 필요합니다.
whuber

제 @whuber 단락은 handwavey 비트임을 솔직히 추가의 단락 (특히 제한)이 비트 rigourous 것으로 가정된다
리처드 팅글

거기에는 논쟁의 여지가 없지만 후자의 자료는 이미 stats.stackexchange.com/a/93833 , stats.stackexchange.com/a/93835stats.stackexchange.com/a/93841 에서 같은 방식으로 다루어 졌습니다. .
whuber

5

시뮬레이션을 사용할 수도 있습니다.

p<-0
for (i in 1:10000){
  a<-0
  while(a != 1){   #Stops when having a girl
    a<-as.numeric(rbinom(1, 1, 0.5))   #Simulation of a new birth with probability 0.5
    p=p+1   #Number of births
  }
}
(p-10000)/10000   #Ratio

1
시뮬레이션 결과는 수학 파생에서 심각한 실수를하지 않았지만 요청 된 엄격한 데모와는 거리가 먼 편안함을 줄 수 있다는 점에서 좋습니다. 특히, 기대에 많은 기여를하는 드문 사건이 발생할 수있는 경우 (예 : 소녀가 나타나기 전에 20 명의 소년이있는 가족과 같이 10,000 명의 가족 시뮬레이션에서 나타날 가능성이 거의 없음) 시뮬레이션이 불안정하거나 불안정 할 수 있습니다. 얼마나 오래 반복 되더라도 잘못되었습니다.
whuber

가족의 소년 수의 기하학적 분포를 인식하는 것이이 문제의 핵심 단계입니다. 시도 :mean(rgeom(10000, 0.5))
AdamO

5

이것을 매핑하면 출생 인구의 비율 (1 : 1로 가정)과 어린이 인구의 비율이 모두 1 : 1이되는 방법을 더 잘 알 수있었습니다. 일부 가정에는 여러 명의 소년이 있지만 한 명의 소녀 만있을 수 있지만 처음에는 소녀보다 많은 소년이 있다고 생각하게되었지만 그 가족의 수는 50 %를 넘지 않으며 추가 아동마다 절반 씩 줄어들 것입니다. 한 소녀 전용 가족의 수는 50 %입니다. 남학생과 여학생의 수는 서로 균형을 이룰 것입니다. 하단에 총 175 개가 표시됩니다. 어린이 비율


2

당신이 얻은 것은 가장 간단하고 정답이었습니다. 신생아가 소년 일 확률이 p이고 잘못된 성별의 어린이가 불행한 사고로 만나지 않으면 부모가 어린이의 성별에 따라 더 많은 어린이를 갖는 것에 대한 결정을 내리는 것은 중요하지 않습니다. 자녀 수가 N이고 N이 크면 p * N 명의 소년을 기대할 수 있습니다. 더 복잡한 계산이 필요하지 않습니다.

"자녀가있는 가족의 가장 어린 아이가 소년 일 확률은 얼마입니까?"또는 "자녀가있는 가족의 가장 오래된 아이가 소년 일 확률은 무엇입니까"와 같은 다른 질문이 있습니다. (이 중 하나에는 간단한 정답이 있고 다른 하나에는 간단한 오답이 있으며 정답을 얻는 것이 까다 롭습니다).


2

허락하다

Ω={(G),(B,G),(B,B,G),}

샘플 공간이되고

X: ΩRω|ω|-1

각 결과 관련 소년 수에 매핑하는 랜덤 변수 여야합니다 . 소년의 예상 가치 인 는 다음과 같습니다. ωE(X)

E(X)=n=1(n-1)0.5n=1 ,

사소한 것은 소녀들의 기대치가 1이므로 비율도 1입니다.


2

까다로운 질문입니다. 비율은 동일하게 유지됩니다 (1 : 1). 정답은 출생률에 영향을 미치지 않지만 가족당 평균 2 명의 출생 제한 요인을 가진 가족당 어린이 수에는 영향을 미친다는 것입니다.

이것은 논리 테스트에서 볼 수있는 일종의 질문입니다. 대답은 출생 비율에 관한 것이 아닙니다. 산만하다.

이것은 확률 질문이 아니라인지적인 추리 질문입니다. 1 : 1 비율로 대답해도 여전히 테스트에 실패했습니다.


최근에 솔루션이 반드시 1 : 1 일 필요는 없음을 보여주기 위해 내 답변을 편집했습니다.
whuber

나는 당신의 대답을 읽었습니다. 문제점에 명시되지 않은 술어를 도입했습니다 (여성의 출생률의 차이). Zorganian Republic이 인간 인구 또는 인간을 대표한다고 주장하는 문제에는 아무것도 없습니다.
Andrew-OpenGeoCode

1
맞습니다. 그러나 모든 출생 확률이 동일하다는 지나치게 단순화 된 가정을 정당화하는 것은 없습니다. 객관적이고 방어 가능한 답변을 제공하기 위해서는 가정이 이루어져야합니다. 따라서 최소한 가정에 대한 명확한 답변을 내리고 그러한 가정에 대한 지원을 제공해야합니다. "이것은 확률 질문이 아니라"고 주장하는 것이 문제를 해결하지는 않지만 문제를 완전히 간과합니다.
whuber

@whuber-이 문제의 출생률은 변하지 않습니다. 문제의 변형은 가족당 출생 수입니다. 문제는 산만하다, 문제의 일부가 아니다. <br/> 측면 사고는 비즈니스에서 종종 언급되는 창의적 사고 또는“상자 밖”에서 영감과 상상력을 사용하여 예상치 못한 관점에서 문제를보고 문제를 해결하는 능력입니다. 측면 사고는 명백한 것을 버리고 전통적인 사고 방식을 버리고 선입견을 버리는 것을 포함합니다. [fyi> 나는 실험실의 주요 과학자입니다]
Andrew-OpenGeoCode

1
그렇다면 당신은 내 대답의 핵심 사항을 간과했을 수도 있습니다. 그 가정은 또한 여성 출생 의 인구 평균 확률이 1 : 1로 변하지 않도록 유지합니다 (구체적으로 묘사 된 구체적인 방식으로). 나는 가정이 비판적으로 검토되는 역설의 결의와 관련하여 실질적인 "측면 적 사고"가 유지 될 것이라고 생각한다. 처음에는 가정을하고 있음을 알기 위해서는 상상력과 훌륭한 분석 기술이 필요하다. 당신이 여기에서하는 것처럼 단순한 "속임수"로 모든 질문을 무시하는 것은 그러한 생각을 홍보하거나 축하하는 데 반추 론적 일 것입니다.
whuber

2

MATLAB 소프트웨어를 사용하여 Monte Carlo 시뮬레이션 (500x1000 제품군)을 위해 작성한 코드를 보여주고 있습니다. 내가 실수하지 않도록 코드를 면밀히 조사하십시오.

결과는 아래와 같이 생성되고 그려집니다. 모의 소녀 출생 확률이 자연 출생 확률 범위의 중지 규칙에 관계없이 기본 자연 출생 확률과 매우 잘 일치 함을 보여줍니다.

여기에 이미지 설명을 입력하십시오

코드를 가지고 놀면 이전에는하지 않았던 한 가지 점을 이해하기가 더 쉽습니다. 다른 점에서 알 수 있듯이 중지 규칙은 산만합니다. 중지 규칙은 고정 된 인구가 주어진 가족 수 또는 다른 관점에서 고정 된 수의 가족이 주어진 아이의 출생 수에만 영향을 미칩니다. 성별은 주사위 롤에 의해서만 결정되므로 비율이나 확률 (아동 수와 무관)은 전적으로 소년 : 소녀 탄생 rato에 달려 있습니다.

testRange=0.45:0.01:0.55;
N=uint32(100000); %Used to approximate probability distribution
M=1000; %Number of families
L=500; %Monte Carlo repetitions
Nfamily=zeros(length(testRange),1);
boys=zeros(length(testRange),1);
girls=zeros(length(testRange),1);
for l = 1:L
    j=1; %Index variable for the different bgratio
    for bgratio=testRange
    k=1; %Index variable for family in each run (temp family id)
    vec=zeros(N,1);
    vec(1:N*bgratio,1)=1; %Approximate boy:girl population for dice roll, 
    %1 = boy

    vec=vec(randperm(s,N)); %Random permutation, technically not necessary 
    %due to randi used later, just be safe
    bog = vec(randi(N)); %boy or girl? (God's dice roll)

    while k<M %For M families...
        if bog == 1 %if boy:
            boys(j) = boys(j)+1; %total global boys tally
        else
            girls(j)=girls(j)+1; %total global girls tally
            %Family stops bearing children
            Nfamily(j) = Nfamily(j)+1; %total global family tally
            k=k+1; %temp family id
            %Next family...
        end
        bog=vec(randi(N)); %Sample next gender (God's dice roll)
    end

    j=j+1; %Index variable for the different bgratio
    end
end
figure;
scatter(testRange,girls./(boys+girls))
hold on
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.44 0.56 0.44 0.56])

2

자녀가 각각 남자 또는 여자 인 경우 국가 의 자식을 나타내는 임의 변수 가 값 1과 0을 취하도록합니다. 각 출생이 소년 또는 소녀 일 때의 한계 확률이 라고 가정하십시오 .ithXi0.5

국가의 예상 남학생 수 = ( 은 국가의 자녀 수)E[iXi]=iE[Xi]=0.5nn

유사하게 = 입니다.E[i(1Xi)]=iE[1Xi]=0.5n

출생의 독립성은 기대 값 계산과 관련이 없습니다.


Apropos @ whuber의 답변, 가족간에 한계 확률의 변동이있는 경우 비율이 소년보다 확률이 낮은 가족보다 소년 확률이 높은 가족에 더 많은 아이들이 있기 때문에 비율이 소년에 대해 왜곡됩니다. 소년의 예상 가치 합계


2

다른 사람들이 한 일을보기 전에 matlab에서 시뮬레이션을 독립적으로 프로그래밍했습니다. 엄밀히 말하면 실험을 한 번만 실행하기 때문에 MC가 아닙니다. 그러나 결과를 얻기에는 한 번이면 충분합니다. 시뮬레이션 결과는 다음과 같습니다. 나는 태어날 확률이 p = 0.5 일 확률에 기초하지 않습니다. 나는 출생 확률이 Pr (Boys = 1) = 0.25 : 0.05 : 0.75의 범위에 걸쳐 변하게한다

내 결과는 확률이 p = 0.5에서 벗어날 때 섹스 비율이 1과 다르다는 것을 보여줍니다. 기대에서 섹스 비율은 단순히 소년의 출생 확률과 소녀의 출생 확률의 비율입니다. 즉, 이것은 @ månst에 의해 이전에 식별 된 기하 랜덤 변수입니다. 이것이 원래 포스터가 직감적이었다고 생각하는 것입니다.

필자의 결과는 소년이 태어난 0.45, 0.50 및 0.55 확률의 성별 비율과 일치하는 MATLAB 코드로 위의 포스터가 한 일을 모방합니다. 더 빠른 코드로 결과를 얻기 위해 약간 다른 접근 방식을 취하면서 내 것을 제시합니다. 비교를 수행하기 위해 코드 섹션 vec = vec (randperm (s, N))을 생략했습니다 .s는 코드에 정의되어 있지 않으므로이 변수의 원래 의도를 알지 못합니다 (이 코드 섹션은 원래처럼 불필요한 것으로 보입니다. 정해진).

내 코드를 게시합니다

clear all; rng('default')

prob_of_boy = 0.25:0.05:0.75;
prob_of_girls = 1 - prob_of_boy;

iterations = 200;

sex_ratio = zeros(length(prob_of_boy),1);
prob_of_girl_est = zeros(length(prob_of_boy),1);
rounds_of_reproduction = zeros(length(prob_of_boy),1);

for p=1:length(prob_of_boy)

    pop = 1000000;

    boys = zeros(iterations,1);
    girls = zeros(iterations,1);
    prob_of_girl = zeros(iterations,1);

    for i=1:iterations

        x = rand(pop,1);
        x(x<prob_of_boy(p))=1;

        %count the number of boys and girls
        num_boys = sum(x(x==1));

        boys(i) = num_boys;
        girls(i) = pop - num_boys;

        prob_of_girl(i) = girls(i)/(pop);

        %Only families that had a boy continue to reproduce
        x = x(x==1);

        %new population of reproducing parents
        pop = length(x);

        %check that there are no more boys 
        if num_boys==0

            boys(i+1:end)=[];
            girls(i+1:end)=[];
            prob_of_girl(i+1:end)=[];
            break

        end
    end

    prob_of_girl_est(p) = mean(prob_of_girl(prob_of_girl~=0));
    sex_ratio(p) = sum(boys)/sum(girls);
    rounds_of_reproduction(p) = length(boys);
end

scatter(prob_of_girls,prob_of_girl_est)
hold on
title('Est. vs. True Probability of a Girl Birth')
ylabel('Est. Probability of Girl Birth')
xlabel('True Probability of Girl Birth')
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.2 0.8 0.2 0.8])

scatter(prob_of_girls,sex_ratio)
hold on
title('Sex Ratio as a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Sex Ratio: $\frac{E(Boys)}{E(Girls)}$','interpreter','latex')

scatter(prob_of_girls,rounds_of_reproduction)
hold on
title('Rounds of Reproduction a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Rounds of Reproduction')

많은 수의 강력한 법칙을 고려할 때 다음 그래프가 예상됩니다. 나는 그것을 재현하지만 중요한 그래프는 두 번째 그래프입니다.

여기에 이미지 설명을 입력하십시오

여기서, 아이의 성별이 태어날 때 0.5 이외의 모집단 확률은 전체 모집단의 성별 비율을 변경합니다. 출생이 독립적이지만 (생식을 계속 선택하는 것은 아님), 각 조건부 재생산에서 모집단 확률은 소년과 소녀의 출생 결과의 전체 구성을 결정합니다. 다른 사람들이 언급했듯이, 문제의 중지 규칙은 이것을 기하학적 분포로 식별 한 포스터가 대답 한 것처럼 인구 결과와 중요하지 않습니다.

여기에 이미지 설명을 입력하십시오

완전성을 위해, 중지 규칙이 영향을 미치는 것은 모집단의 재생산 횟수입니다. 실험을 한 번만 실행하기 때문에 그래프가 약간 들쭉날쭉합니다. 그러나 직감이 있습니다 : 주어진 인구 규모에 대해, 소녀의 출생 확률이 증가함에 따라 전체 인구가 재생산을 멈추기 전에 가족이 원하는 소녀를 얻기 위해 생식 횟수가 더 적음을 알 수 있습니다 (반드시 라운드 수는 예를 들어 가족이 첫 소녀를 갖기 전에 49 명의 소년을 가질 가능성을 기계적으로 증가시키기 때문에 인구 규모)

여기에 이미지 설명을 입력하십시오

계산 된 성비의 비교 :

[sex_ratio' prob_of_boy']

0.3327    0.2500
0.4289    0.3000
0.5385    0.3500
0.6673    0.4000
0.8186    0.4500
1.0008    0.5000
1.2224    0.5500
1.5016    0.6000
1.8574    0.6500
2.3319    0.7000
2.9995    0.7500

그리고 matlab 코드가있는 이전 포스터의 것들 :

[boys./girls testRange']

0.8199    0.4500
0.8494    0.4600
0.8871    0.4700
0.9257    0.4800
0.9590    0.4900
1.0016    0.5000
1.0374    0.5100
1.0836    0.5200
1.1273    0.5300
1.1750    0.5400
1.2215    0.5500

그들은 동등한 결과입니다.


1

가족 수에 따라 다릅니다.

하자 가정에서 아이들의 숫자, 그 기하학적 확률 변수 , 즉, 의미Xp=0.5

P(X=x)=0.5x,x=1,2,3...
E(X)=2

국가에 가족 이 있다고 가정 하면 소녀 비율은 N

NXi

이후 (큰 수의 법칙), 1/2 비율 커버리지 경우 .Xi/NE(X)=2N

유한 가족 만있는 경우 국가의 총 자녀 수로 하자 : 이면 는 pmf TT=XiT

P(T=t)=CN1t10.5t,t=N,N+1...

그것은 암시 여기서 은 초기 하 함수입니다.(2)F(1)

E[NXi]=E[NT]=t=NNtCN1t10.5t=2F1(N,1,N+1,1)
2F1

따라서 예상 소녀 비율은 입니다.2F1(N,1,N+1,1)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.