요약
모든 출생이 독립적으로 소녀가 될 확률이 50 %라는 간단한 모델은 비현실적이고 예외적입니다. 모집단 간의 결과 변동에 따른 결과를 고려하자마자, 소녀 대 소년의 비율은 1 : 1을 초과하지 않는 모든 값 이 될 수 있습니다 . (실제로는 여전히 1 : 1에 가깝지만 데이터 분석이 결정해야하는 문제입니다.)
이 두 가지 상충되는 답변은 출생 결과의 통계적 독립성을 가정함으로써 얻어 지므로 독립에 대한 호소는 불충분 한 설명입니다. 따라서 (여성 출생의 가능성에서) 변이 가 역설의 핵심 아이디어 인 것으로 보인다.
소개
역설은 우리가 무언가를 믿을만한 충분한 이유가 있다고 생각할 때 발생하지만 그 반대에 대한 확고한 주장에 직면합니다.
역설에 대한 만족스러운 해결책은 우리가 옳은 것과 두 가지 논쟁 에 대해 무엇이 잘못되었는지를 이해하는 데 도움이됩니다 . 확률과 통계에서 종종 그렇듯이 두 가지 주장 모두 실제로 유효 할 수 있습니다. 해결책 은 내재적으로 가정 된 가정 간의 차이에 달려 있습니다. 이러한 다른 가정을 비교하면 상황의 어떤 측면이 다른 답변으로 이어지는지를 식별하는 데 도움이 될 수 있습니다. 이러한 측면을 파악하는 것이 가장 중요하게 생각합니다.
가정
지금까지 게시 된 모든 답변에서 알 수 있듯이, 여성 출생은 독립적 으로 지속적 으로 확률 로 발생한다고 가정하는 것이 당연합니다 . 어느 가정도 실제로 사실이 아니라는 것은 잘 알려져 있지만, 이러한 가정과의 약간의 편차는 대답에 큰 영향을 미치지 않는 것으로 보입니다. 우리에게 보여줘. 이를 위해 다음과 같은보다 일반적이고 현실적인 모델을 고려하십시오.1/2
각 가정에서 여성 출생 확률 상수 없이 출생 순서.ipi
중지 규칙이 없으면 인구에서 예상되는 여성 출생 수는 예상되는 남성 출생 수에 근접해야합니다.
모든 출생 결과는 (통계적으로) 독립적입니다.
이것은 가 부모 (특히 어머니)의 나이에 따라 달라질 수 있는 완전히 현실적인 인간 출생 모델이 아닙니다 . 그러나보다 일반적인 모델에 적용 할 역설의 만족스러운 해상도를 제공하는 것은 충분히 현실적이고 유연합니다.pi
분석
이 모델을 철저히 분석하는 것은 흥미롭지 만, 구체적이고 단순한 (그러나 다소 극단적 인) 버전을 고려하더라도 주요 요점은 분명해집니다. 인구에 가족 이 있다고 가정하십시오 . 이 중 절반에서 여성의 출생 확률은 이고 다른 절반에서 여성의 출생 확률은 입니다. 이것은 명백하게 조건을 만족시킨다 (2) : 예상되는 여성 및 남성 출생의 수는 동일하다.2N2/31/3
그 첫 가족을 고려하십시오 . 실제 결과가 임의적이므로 예상과 약간 다를 수 있다는 점을 이해하면서 기대의 관점에서 추론합시다. (다음 분석의 배후에있는 아이디어는이 게시물의 끝에 나오는 원래의 답변으로 더 간단하고 간단하게 전달되었습니다.)N
일정한 여성 출생 확률 갖는 모집단에서 가 예상되는 여성 출생 수라고 하자 . 분명히 이것은 비례 하므로 이라고 쓸 수 있습니다 . 유사하게, 이 예상되는 남성 출산 수 라고하자 .f(N,p)NpNf(N,p)=f(p)Nm(p)N
첫 번째 가족은 소녀를 생산하고 멈 춥니 다. 다른 가족은 소년을 낳고 계속해서 아이를 낳습니다. 그건 소녀 지금까지 소년.pN(1−p)NpN(1−p)N
나머지 가족은 이전과 같은 위치에 있습니다.(1−p)N 독립 가정 (3)은 장래에 경험하는 것이 장남이 아들이라는 사실에 영향을받지 않음을 의미합니다. 따라서, 이들 가족은 더 많은 소녀와 더 많은 소년 을 생산할 것 입니다.f(p)[(1−p)N]m(p)[(1−p)N]
총 여아와 남학생을 합산하고 과 의 가정 된 값과 비교 하면 방정식이 제공됩니다.f(p)Nm(p)N
f(p)N=pN+f(p)(1−p)N and m(p)N=(1−p)N+m(p)(1−p)N
솔루션으로
f(p)=1 and m(p)=1p−1.
인 첫 번째 가족 의 예상 소녀 수는 이고 예상 소년 수는 입니다.Np=2/3f(2/3)N=Nm(2/3)N=N/2
인 두 번째 패밀리 의 예상 소녀 수는 이고 예상 소년 수는 입니다.Np=1/3f(1/3)N=Nm(1/3)N=2N
총계는 소녀와 소년입니다. 큰 경우 기대 비율은 기대 비율에 가깝습니다.(1+1)N=2N(1/2+2)N=(5/2)NN
E(# girls# boys)≈2N(5/2)N=45.
그만두는 규칙은 소년들에게 유리합니다!
보다 일반적으로 확률 와 독립적으로 소녀를 낳는 가족의 절반과 확률 독립적으로 소년을 낳는 가족의 절반으로 조건 (1) ~ (3)이 계속 적용되고 큰 접근에 대한 예상 비율p1−pN
2p(1−p)1−2p(1−p).
에 따라 사이 코스 거짓말하는 과 ,이 값이 될 수 있습니다 어디서나 사이의 과 (그러나 결코 어떤보다 큰 ). 경우에만 최대 값이 입니다. 다시 말해, 1 : 1의 예상 소녀 대 소년 비율은 첫 번째 소녀와 함께 멈추는 것이 더 많은 소년들에게 유리하다는 더 일반적이고 현실적인 규칙에 대한 특별한 예외입니다.p010111p=1/2
해결
첫 번째 소녀와 함께 멈추는 것이 인구에서 더 많은 소년을 생산 해야 한다는 직감이 있다면 이 예에서 볼 수 있듯이 맞습니다. 올바른 것을 얻으려면 소녀를 낳을 확률은 가족마다 (아마도 조금씩) 다릅니다.
비율이 1 : 1에 가까워 야한다는 "공식적인"대답은 몇 가지 비현실적인 가정을 필요로하며 이들에 민감합니다. 가족간에 차이가없고 모든 출생이 독립적이어야한다고 가정합니다.
코멘트
이 분석에서 강조된 핵심 아이디어 는 모집단 내의 변동이 중요한 결과를 초래 한다는 것입니다. 출생의 독립성은 (이 스레드의 모든 분석에 사용되는 단순화 된 가정 임에도 불구하고) 역설을 해결 하지 않습니다 . 왜냐하면 다른 가정에 따라 공식적인 대답과 그 반대와도 일치하기 때문입니다.
그러나 예상 비율이 실질적으로 1 : 1에서 출발 하려면 모집단 의 간에 많은 변화 가 필요합니다 . 모든 가 0.45와 0.55 사이라면,이 변화의 영향은 눈에 띄지 않을 것입니다. 실제로 사람 인구 에 있는지에 대한이 질문을 해결 하려면 상당히 크고 정확한 데이터 세트가 필요합니다. 일반화 된 선형 혼합 모델을 사용 하고과 분산을 테스트 할 수 있습니다 .pipipi
성별을 다른 유전자 발현으로 대체하면 자연 선택에 대한 간단한 통계적 설명을 얻을 수 있습니다. 유전자 구성에 따라 자손의 수를 차등 적으로 제한하는 규칙은 다음 세대에서 유전자의 비율을 체계적으로 변경할 수 있습니다. 유전자가 성적으로 연결되어 있지 않으면, 작은 효과조차도 연속적인 세대를 통해 곱셈으로 전파되어 빠르게 확대 될 수 있습니다.
원래 답변
각 어린이에게는 출생 순서가 있습니다 : 첫째, 둘째, 등.
남성과 여성의 출생 확률이 같고 성별간에 상관 관계가 없다고 가정 할 때, 다수의 약한 법칙은 첫 번째 여성과 남성의 비율이 1 : 1에 가깝다고 주장 합니다. 같은 이유로 두 번째로 태어난 여성과 남성의 비율은 1 : 1에 가깝습니다. 이러한 비율은 지속적으로 1 : 1이므로 출생 순서의 상대적 빈도가 인구에 어떤 영향을 미치는지에 관계없이 전체 비율도 1 : 1이어야합니다.