1300 년에 태어난 특정 인물의 후손 일 가능성이 얼마나됩니까?


26

즉, 다음을 기준으로 p 란 무엇입니까?

이 문제를 인류학이나 사회 과학이 아닌 수학 문제로 만들고 문제를 단순화하기 위해 형제와 첫 번째 사촌이 결코 짝을 이루지 않고 항상 동일한 항목에서 선택된다는 점을 제외하고는 모집단 전체에서 동일한 확률로 메이트를 선택한다고 가정합니다. 세대.

  • n1 초기 인구
  • g 숫자 생성
  • c 부부 당 평균 자녀 수. (답이 필요한 경우 모든 부부의 자녀 수가 정확히 같다고 가정하십시오.)
  • z 자녀가없고 부부의 일부로 간주되지 않는 사람들의 비율.
  • n2 최종 세대 인구. ( 또는 해야하며 다른 것으로 계산할 수 있습니다.)n2z
  • p 최종 세대의 누군가가 초기 세대의 특정 인물의 후손 일 확률.

이러한 변수는 물론 변경, 생략 또는 추가 할 수 있습니다. 나는 와 가 시간이 지남에 따라 변하지 않는다는 단순성을 가정 하고 있습니다. 나는 이것이 매우 대략적인 추정치를 얻을 것이라는 것을 알고 있지만 시작점입니다.cz

2 부 (추가 연구를위한 제안) :

전체적으로 균일 한 확률로 메이트가 선택되지 않았다고 어떻게 생각할 수 있습니까? 실제로, 동료들은 같은 지리적 영역, 사회 경제적 배경, 인종 및 종교적 배경 일 가능성이 높습니다. 이에 대한 실제 확률을 조사하지 않고 이러한 요인에 대한 변수는 어떻게 작용합니까? 이것이 얼마나 중요할까요?


2
이것은 숙제 질문입니까? 그렇지 않으면, 문맥은 무엇입니까?
David LeBauer

1
@ 존 : 편집 해 주셔서 감사합니다. 이 사이트와 다른 사이트에 대한 일반적인 합의는 단순히 homework태그 를 추가하기 위해 질문을 편집하지 않는다는 것 입니다. 모든 관련자들에게 OP가 그렇게하는 것이 좋습니다. 아직 보지 않았다면 이 메타 스레드에 관심 있을 것입니다.
추기경

나는 단지 궁금하다. 저는 학생이 아니며 이것은 누구의 숙제도 아닙니다. 숙제를 암시하는 방법을 알 수 있지만 추가 크레딧에 대해 농담했습니다.
xpda

3
초기 해답을 얻으려면 하강에 의해 주어진 조상과 관련 이 없는 모집단 의 분수 를 고려하십시오 . 우선 F = ( N - 1 ) / N 의 모집단 N . 랜덤 믹싱을 사용하면 f 는 각 세대마다 제곱 됩니다. 의 시작 인구에서 N = 10 (8) , 말,이 의미 f는 거의 확실하다 032 (약 세대 (600) - (800) 년). ff=(n1)/nnfn=108f032600800
whuber

1
나는 독특한 성씨가 멸종 될 확률에 대한 학문적 연구가 있다고 생각합니다. 제기 된 문제와 동일하지는 않지만 흥미로운 통찰력을 제공 할 수 있습니다 (불행히도 그것이 어디에서 왔는지 기억할 수는 없습니다). 이상하게도, 나는 전염병의 확산 뒤에 수학에 몇 가지 통찰력을 주도하는 연구 ... 생각
마이클 맥고완을

답변:


13

이 질문은 천문학적으로 작은 것에서 거의 100 %까지 다양한 답변을 받고 있기 때문에 개선 된 솔루션에 대한 참조 및 영감을 제공하는 시뮬레이션을 제공하고 싶습니다.

나는 이것을 "화염 플롯"이라고 부릅니다. 각각은 별개의 세대에서 번식 할 때 집단 내에서 유전 물질의 분산을 기록합니다. 줄거리는 사람을 묘사하는 얇은 세로 세그먼트의 배열입니다. 각 행은 세대를 나타내고 시작은 맨 위에 있습니다. 각 세대의 자손은 바로 아래에 있습니다.

처음에는 크기의 모집단에서 한 사람 만 표시되고 빨간색으로 표시됩니다. (보기 힘들지만 항상 맨 오른쪽 줄에 그려져 있습니다.) 그들의 직계 후손도 마찬가지로 빨간색으로 그려져 있습니다. 그들은 완전히 임의의 위치에 나타납니다. 다른 자손은 흰색으로 표시됩니다. 인구 규모는 세대마다 다를 수 있으므로 빈 공간을 채우려면 오른쪽의 회색 테두리가 사용됩니다.n

다음은 20 개의 독립적 인 시뮬레이션 결과 배열입니다.

불꽃 플롯

적색 유전 물질은 9 개의 시뮬레이션에서 결국 사망하여 생존자는 나머지 11 명 (55 %)으로 남았습니다. (하나의 시나리오에서 왼쪽 하단은 전체 인구가 결국 사망 한 것처럼 보입니다.) 생존자가있는 곳은 거의 모든 인구에 적색 유전 물질이 포함되어 있습니다. 이것은 적색 유전자를 포함하는 마지막 세대에서 무작위로 선택된 개체의 확률이 약 50 %라는 증거를 제공합니다.

시뮬레이션은 각 세대의 초기에 생존율과 평균 출생률을 무작위로 결정함으로써 작동합니다. 생존율은 베타 (6,2) 분포에서 도출됩니다. 평균 75 %입니다. 이 숫자는 성인이되기 전의 사망률과 자녀가없는 사람을 나타냅니다. 출생률은 감마 (2.8, 1) 분포에서 가져 오므로 평균 2.8입니다. 결과적으로 일반적으로 높은 사망률을 보상하기에 불충분 한 생식 능력에 대한 잔인한 이야기가 있습니다. 그것은 매우 비관적이고 최악의 모델을 나타냅니다. 그러나 (설명에서 제안한 바와 같이) 인구의 성장 능력은 필수적이지 않습니다. 각 세대에서 중요한 것은 인구 내에서 적색 의 비율 입니다.

재생산을 모델링하기 위해, 원하는 크기의 간단한 랜덤 샘플을 취함으로써 현재 모집단이 생존자로 얇아집니다. 이 생존자들은 무작위로 짝을 짓습니다 (페어링 후에 남은 이상한 생존자는 재생산되지 않습니다). 각 쌍은 포아송 분포에서 나온 많은 수의 어린이를 생산하며 그 평균은 세대의 출생률입니다. 부모 중 하나 에 빨간색 마커가 포함되어 있으면 모든 자식이이를 상속받습니다. 이는 부모 중 하나를 통한 직접 하강의 아이디어를 모델링합니다.

이 예제는 모집단 512로 시작하여 11 세대 (시작을 포함하여 12 행)에 대한 시뮬레이션을 실행합니다. 적은으로 시작하여 시뮬레이션의 변화 과 많은 등 2 14 = 16 , 384 의 생존 출생 비율, 모든 전시 유사한 특성의 다른 양을 사용했습니다 : 말까지 로그 2 ( N ) 세대 (구 이 경우), 모든 빨강이 죽었을 확률은 약 1/3이지만, 그렇지 않은 경우 대다수의 인구가 빨강입니다. 2 세대 또는 3 세대 내에서 거의 모든 인구가 적색이며 적색으로 유지됩니다 (또는 인구는 모두 사망합니다).n=8214=16,384log2(n)

그건 그렇고, 한 세대에서 75 % 이하의 생존율은 공상적이지 않습니다. 1347 년 후반에 유행성 전염병에 걸린 쥐는 처음부터 아시아에서 유럽으로 향했다. 그 후 3 년 동안 유럽 인구의 10 %에서 50 % 사이가 사망했습니다. 그 후 재앙 은 수백 년 동안 한 세대 에 걸쳐 거의 한 번 재발 했다.


암호

시뮬레이션은 Mathematica 8 로 작성되었습니다 .

randomPairs[s_List] := Partition[s[[Ordering[RandomReal[{0, 1}, Length[s]]]]], 2];

next[s_List, survive_, nKids_] := Flatten[ConstantArray[Max[#], 
   RandomVariate[PoissonDistribution[nKids]]] & /@ 
   randomPairs[RandomSample[s, Ceiling[survive Length[s]]]]] 

Partition[Table[
   With[{n = 6}, ArrayPlot[NestList[next[#, RandomVariate[BetaDistribution[6, 2]], 
        RandomVariate[GammaDistribution[3.2, 1]]] &, 
        Join[ConstantArray[0, 2^n - 1], ConstantArray[1, 1]], n + 2], 
     AspectRatio -> 2^(n/3)/(2 n), 
     ColorRules -> {1 -> RGBColor[.6, .1, .1]},  
     Background -> RGBColor[.9, .9, .9]]
    ], {i, 1, 20}
   ], 4] // TableForm

1
이런 모델링이 최선의 방법이라고 생각합니다. 수학보다 훨씬 간단하고 재미있어서 메이트 선택을 제한하는 요소를 도입하는 것이 훨씬 쉬워야합니다. 이에 대해 자세히 알아보기 전에 권장 사항, 경고 또는 기타 조언이 있습니까?
xpda

3
@xpda 수학 솔루션은 중요한 것과 그렇지 않은 것에 대한 통찰력을 제공합니다. 예를 들어, 많은 인구를 모델링 할 필요는 없음을 보여줍니다. 또한 변동성에 의해 수행되는 역할을 나타내며, 이는 분석적으로 다루기가 더 어렵고 시뮬레이션에서 가장 중요합니다.
whuber

1
@whuber Mathematica에서 시뮬레이션을 실행 했습니까? 코드를 게시 하시겠습니까?
예상 노멀

1
@Max 코드가 작동합니다. 의견이 없기 때문에 죄송합니다. 당신이 각각 실행하는 경우 randomPairsnext테스트 데이터에를, 그 기능은 명확하게해야한다. 여러 세대를 생성하기 위해 NestList반복 next을 사용하는 것에 주목하십시오 .
whuber

3

조상을 세려고하면 어떻게됩니까?

당신이 부모, 4 조부모, 8 증조부모을 가지고 ... 그래서 당신이 돌아 가면 세대는, 당신은 2 N 조상. 평균 생성 기간이 25 년 이라고 가정 해 봅시다 . 그리고 1300 년 이래 약 28 세대 가 있었는데 , 그 당시 약 2 억 6 천 2 백만의 조상 이 생겼 습니다.n2n2528

이것은 올바른 구장이지만 1300 년 지구 인구는 균일하게 혼합되지 않았기 때문에 조상 "트리"내에서 결혼을 무시하고 있습니다. 즉, 우리는 일부 조상을 두 번 세고 있습니다.

그래도 1300 년에 무작위로 선택된 사람이 1300 의 인구 대비 의 비율을 취함으로써 조상이 될 확률에 대한 올바른 상한선으로 이어질 수 있다고 생각합니다.228


2
당시 많은 사람들이 서로 고립되어 있다는 점을 고려할 때 매우 중요하므로 결혼을 피할 수있는 기회가 훨씬 적었습니다.
dcl

2
영국의 인구가 1300 명을 넘었을 때 영국 출신의 OP가 있다고 가정 해 봅시다. (큰 기근 전에 말합시다). 분석 결과가 어떻게 변할까요?
dassouki

만 달러,하지 억. 올바른 야구장입니다. 228268
whuber

도! 답변을 수정했습니다. 계산은 여전히 근친 결혼 무시하지만이 상위 1300에서 무작위로 선택된 사람이 부분을 고려하여 조상 확률에 바인딩 올바른 줄 수 : 또는 4 억을. 228/34
vqv

2

더 멀리 갈수록 그 당시에 살았던 유전자를 성공적으로 통과 한 사람과 관련이있을 가능성이 큽니다. 1300 년에 살았던 15 억 명의 조상 중 많은 사람들이 가계도에 수백 (수천, 수백만) 번 나타날 것입니다. 유전 적 표류와 우리가 누군가와 직접 관련되는 횟수는 우리 조상보다 유전자 코드의 차이와 더 관련이 있습니다.


0

확률은 1-z이며,이 문제의 모든 후손은 위의 조상과 관련이 있습니다. 초기 생식 률 (1-z)이 무엇이든, 초기 모집단의 누군가에게서 후손 할 확률은 확실하지 않으며, 최종 모집단에서 생존 가능성은 확실하지 않습니다.

Erad의 답변에 동의하지만, 지금은 질문하지 않은 질문, 즉 선조에 대해 알려진 생식 및 인구 제한이 주어질 확률에 대해 응답한다고 생각합니다.


n1zzg

또한, 명확히하기 위해, 문제는 확률 찾을 수 있습니다 특정 사람 의 후손되는 마지막 세대에서 특정 개인 의 초기 세대를.
xpda

1
AAAA

@Wipa Descartes의 cogito, ergo sum 은 전조에 대한 제한이 100 % 일 때 살아남을 확률 이 100 % 라고 강력하게 제안합니다. :-)
whuber

@ whuber, 맞습니다. 나는 우리가 같은 문제에 대해 이야기하고 있다고 생각합니다. 내가 명확히하고 싶었던 것은 1 세대의 누군가가 마지막 세대에 자손을 낳을 가능성을 찾고 있지 않다는 것입니다. Wipa가 대답을 위해 (1-z)를 생각 해낸 곳이 두렵습니다.
xpda

0

p>(1z)×1n1(1z)2=2n1

답변 설명 :
오늘날 특정 사람을 고려할 때 1300 년 에 최소 2 명의 후손임을 확신 할 수 있습니다 .

1300 년에 특정 사람을 고를 때, 사람이 번식 할 가능성은 (1-z)가 없으며, 다른 용어는 '부부 부부'의 수와 사람이이 부부와 관련 될 가능성에 대한 것입니다 (1 / 커플 수).

(1-z)가 취소되어 남습니다.

p>2n1


nk+1=nk(1z)×c2=n1(1z)kck2k







p>2/360,000,000=5.56×109

읽어 주셔서 감사합니다, Erad


cz

위의 원래 질문을 바탕으로 : c = 부부 당 평균 자녀 수, z = 자녀가없는 사람의 비율
Erad

2
1/n1/360M109

3
360,000,000/(2.66×10249)1

1
108

0

이것은 프랙탈을 수학적으로 해결하도록 요구하는 매우 흥미로운 질문입니다. 인생 의 유명한 게임과 같은 .

에서 시작하여 각 반복마다 각 세대와 관련된 인구의 %p1=2n1limkpk=(1z)

pkk

p1=2n1

p2=relatives×2n2+non.relatives×4n2
relatives=(c2)×nc(n2)=c1n1
=나는이자형나는에이이자형.아르 자형이자형에이나는V이자형에스×4+기음영형에스나는에스×6+영형.아르 자형이자형에이나는V이자형에스×8

각 세대마다, 초기 인구에서 누군가와 관련 될 확률은 의심 할 여지없이 증가 할 것이지만 감소하는 속도로 증가 할 것입니다. 동일하거나 유사한 나무에서 나오는 "친척"을 그릴 확률이 커지기 때문입니다.

민족성을 예로 들어 보자. 누군가가 100 % 백인이라는 사실을 알 수 있습니다. 28 세에 그는 1300 년에 백인 인구의 상당 부분과 관련이있을 가능성이 높습니다 (@whuber 시뮬레이션으로 표시). 그가 다른 민족의 100 % 인 사람과 결혼한다고 가정 해 봅시다. 그들의 자손은 1300 년부터 약 2 배의 사람들과 연결될 것입니다.

또 다른 흥미로운 생각은 인간 (호모 사피엔) 인종이 아프리카에서 약 600 명에서 시작되었다는 점을 감안할 때, 우리는 성공적으로 교배 한 모든 이들의 유전 적 치환 일 가능성이 높습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.