윤일에 태어날 확률은?


31

오늘이 도약 일이라는 점을 감안할 때 누군가 도약 당일에 태어날 확률을 알고 있습니까?


30
출생은 일년 내내 균일하게 분포되지 않으므로 무작위로 선택한 날이 윤년 일 확률은 어느 날에 생길 확률과 동일하지 않습니다.
벤 밀우드

17
누구 태어난? 역사상의 모든 사람들? 오늘? 모든 사람들이 살아 있습니까? 장래에 미래? 참조하는 이벤트가 명확하게 정의되어 있지 않으면 확률은 의미가 없습니다.
whuber

15
오늘 태어난 사람들의 100 %가 될 것입니다. 도움이 되나요?
aslum

8
많은 부모님들은 자녀들이 도약 당일에 태어난 것을 원하지 않습니다. 따라서 예정된 C 섹션이 증가함에 따라 확률은 임의의 날보다 낮습니다. fivethirtyeight.com/features/…
James Lawruk

3
@whuber에 동의합니다. 질문이 잘못 정의되어 있습니다. 확률 공간의 적절한 정의가 없으면 질문에 대답 할 수 없습니다. 따라서 공감.
mpiktas

답변:


24

확실한. 자세한 설명은 http://www.public.iastate.edu/~mlamias/LeapYear.pdf를 참조하십시오 .

그러나 본질적으로 저자는 "2 천년에 485 년의 윤년이있다. 따라서 2 천년에 일이있다. 그 중 2 월 29 일은 그 중 485 개 (윤년)이므로 확률은 "485 / 730,485 = 0.0006639424485(366)+(2000485)(365)=730485485/730485=0.0006639424


9
1 / (4 년의 일수) = 1/1461 = 0.00068로 계산할 수 없습니까?
Siddhesh

21
@Siddhesh 세기에 관한 규칙이 있습니다. 따라서 2100은 윤년이 아닙니다
Rentrop

8
@Siddhesh, 불행히도, 그렇게 간단하지 않습니다. 윤년은 좀 더 복잡합니다. 평균 연도는 실제로 평균 365.24 일이 아닌 365.2425 일입니다. 위키피디아 도약 연도 페이지에 기록 된 "그레고리오 력 달력은 도약주기의 길이 인 400 년마다 3 개의 도약 일을 제거합니다. 이것은 3 세기 동안 2 월 29 일을 제거함으로써 이루어집니다 (100의 배수). 2000 년과 2400 년은 윤년이며 1800 년, 1900 년, 2100 년, 2200 년, 2300 년과 2500 년은 공통 년입니다. "
Stats 학생

10
왜 2000 년을 고려해야하는지 모르겠습니다. 윤년은 400 년주기이므로, 왜 "400 년에 97 년 윤년이 있는가"로 줄이지 않겠습니까?
Philip Kendall

7
왜 우리는 세기의 "취소 된"도약 일과 같이 400의 배수가 아니라 2 월 29 일 이전에 지연되거나 소개 된 거의 모든 출생과 같은 외부 영향을 고려하지 않는 작은 영향을 고려해야 하는가? 아이가 불편에서 (또는 다른 이유로)? -적어도 독일에서는 2 월 29 일에 출생 확률이 거의 0에 가깝습니다.
저는 Monica와 함께

23

통계를 사용하여 확률을 정확하게 예측하려면 출생 위치를 아는 것이 도움이 될 것입니다.

이 페이지 http://chmullig.com/2012/06/births-by-day-of-year/ 에는 하루의 출생 수의 하위 집합 (29에 4를 곱한 값이 잘못되어 바람직하지 않음)이있는 그래프가 있습니다. 이 질문에 대한 답변이지만 미국의 원본 데이터와 연결되어 있으며 예상되는 결과를 대략적으로 보여줍니다. 나는이 곡선이 다른 국가, 특히 다른 대륙에서는 그렇지 않다고 가정합니다. 특히 남반구와 적도 지역은 기후가 결정적인 요인이라고 가정 할 때 이러한 결과로부터 실질적인 도출을 보여줄 수 있습니다.

또한, "선택적인 출생"( http://bmjopen.bmj.com/content/3/8/e002920.full 의 저자가 다루는) 문제가 있습니다 -지구의 빈곤 한 지역에서는 다른 것을 기대할 것입니다 (비 응급-) 제왕 절개 또는 유발 된 출산이 선진국보다 드물기 때문에 출생 분포. 이것은 출생의 최종 분포를 왜곡합니다.

미국 데이터를 사용하여 2 월 29 일 ~ 71 백만 ~ 출생 (거의 평균 * 366) 및 46.000 건을 가정하고 정확한 기간이 표시되지 않기 때문에 데이터에 윤년 분포를 수정하지 않음 약 ~ 0.000648. 이것은 평평한 출생 분포를 감안할 때 예상되는 값보다 약간 낮으므로 그래프의 일반적인 인상과 일치합니다.

나는이 대략적인 추정에 대한 중요성 테스트를 동기 부여 독자들에게 맡길 것이다. 그러나 29 일 (수정되지 않았지만-2000 년에 데이터에 대한 평균 편향을 주입 함)은 이미 낮은 2 월 표준에서도 낮은 점수를 받았다는 점을 감안할 때, 등분 포의 귀선 이완증이 기각 될 수 있다는 비교적 높은 신뢰를 가정합니다.


1
데이터 세트의 날짜는 2 월 30 일과 31 일입니다. 재밌 네요 분석하기 전에 정리가 필요하지만 많은 데이터가 있습니다.
Aksakal

22

이 질문에 대한 답은 경험적 일 뿐이라고 생각합니다. 생일 선택 현상, 계절성 등을 설명하지 않으면 이론적 대답에 결함이있을 수 있습니다. 이론적으로 다루기가 불가능합니다.

개인 정보 보호를 위해 생일 데이터는 미국에서 찾기가 어렵습니다. 여기에 익명의 데이터 세트가 있습니다 . 미국의 보험 응용 프로그램에서 가져 왔습니다. 자주 인용되는 NYT 기사 와 같은 다른 보고서와의 차이점은 1 년의 단순한 순위 대신 날짜별로 출생 빈도를 나열한다는 것입니다. 약점은 물론 보험에서 비롯된 샘플링 편향입니다. 무보험 자 등은 포함되지 않습니다.

데이터에 따르면, 총 481040 년 2 월 29 일에 325 건의 출생이있었습니다. Roy Murphy 에 따르면 이 샘플은 1981 년부터 1994 년까지 걸렸습니다. 총 14 년의 3 윤년이 포함됩니다. 조정이 없으면 1981 년에서 1994 년 사이 2 월 29 일에 태어난 확률 은 0.0675 %입니다.

윤년의 빈도를 고려하여 확률을 조정할 수 있습니다 . 예를 수치에 를 곱하여 0.079 % 추정치에 도달하는 등 1/4에 가깝습니다 ( 정확하지는 않음 ) . 여기서 윤년에 2 월 29 일에 태어난 조건부 확률 는 표본에서 윤년 의 주파수 에 의해 관측 된 주파수 와 연결됩니다 . 여기서 는 표본의 년 수이며, 은 총 출생 빈도입니다.(P) F에서 O = 325 F에서 L = 3 F O = F L / N F P , N = 14 F = 481,04014/12pFo=325fL=3

Fo=fL/NFp,
N=14F=481040

일반적으로 윤년 확률은 이므로 2 월 29 일에 태어난 장기 평균 확률 은 다음과 같습니다. P L P L = P는 LP P는 LNpL1/4PL

PL=pLppLNfLFoF0.079%

윤년에 태어났다는 가정하에 2 월 29 일에 태어난 조건부 확률 에 관심이있을 수 있습니다 . p = Np

p=NfLFoF0.32%

따라서 과 의 연결은 몇 가지 가정을 기반으로합니다. 예를 들어 주어진 연도에 태어날 확률은 일정하고 변경되지 않습니다. pPLp

물론이 논의는 미국 중심이었다. 다른 나라의 패턴이 무엇인지 아는 사람.

업데이트 : OP는 그레고리력이라고 자동 가정했습니다. 윤년이 30 년 정도 되는 음력 Hijri 와 같은 다른 달력을 고려하면 훨씬 더 흥미로워집니다 .

업데이트 2 :

놀라운 것은 추정 된 확률 가이 샘플에 대해 2 월 29 일에 예상되는 생일 발생을 초래한다는 것입니다 : . 이것은 1 월 1 일과 12 월 25 일보다 낮으며 NYT의 위 순위와 일치합니다! 데이터 소스 만 설명하지 않고을 참조 하지만 동일하거나 결과가 강력합니다.F p = 1 , 527pFp=1,527Amitabh Chandra, Harvard University

자, 그레고리력의 달력에서 1 월 1 일, 12 월 25 일, 뎁 29 일이 가장 인기있는 생일이 될 확률은 얼마나 될까요? 나는 그것이 무작위로 일어날 가능성이 거의 없다고 말합니다. 따라서 Hijri와 같은 다른 캘린더에서 무슨 일이 일어나고 있는지 보는 것이 훨씬 더 흥미 롭습니다.

업데이트 3 :

참고 둘 것을 순진 이론 예상보다 높은 :PL,p

P의 LP366

p^1/3660.27
P^Lp3663654+10.068

업데이트 4 :

벤 밀우드 (Ben Millwood)는 해마다 출생 분포가 일정하지 않다고 언급했다. 이 진술을 시험해 볼 수 있습니까? 내 데이터 세트를 사용 하여 분포가 균일하다는 귀무 가설로 이론적 분포에 대해 테스트 를 실행할 수 있습니다 . 결과는 기각입니다. 즉 분포가 균일하지 않은 것 같습니다.χ2

이론적 분포는 다음과 같습니다. 우리는 생년월일이 모든 역일에 걸쳐 일정하다고 가정합니다. 즉 14 년 동안 일에 걸쳐 있습니다. 그런 다음 일 수를 366 일로 늘립니다. 분명히 3 일의 윤일과 14 일의 비 윤일이 발생했습니다. 아래는 이론적 및 경험적 비교를위한 MATLAB 코드와 분포도입니다.14365+3

d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs

idL = 60; % index of Feb 29

% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days

fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;

fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))

% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on

% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)

산출:

non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000

h =

     1


p =

     0

여기에 이미지 설명을 입력하십시오


3
유용한 분석입니다 (+1). 분석 하는 빈도 와 질문에 요청 된 (모호하게 정의 된) 확률 사이에 어떤 연결이 있는지 궁금 합니다.
whuber

1
@ whuber, 내 대답의 확률은 보험 응용 프로그램이나 일부 사용자 데이터 분석과 같은 경우입니다. 예를 들어, 웹 사이트가 있고 문제가있는 사용자 데이터에 플래그를 지정하려고합니다. 2 월 29 일 생일의 빈도와 내 확률을 비교할 수 있습니다. 그러나 가족을 계획 하고이 질문을하면 내 숫자는 거의 쓸모가 없습니다. 그 이유는 정확히 부부가 실제로 교미하거나 생식하는시기 및 생년월일의 주요 결정 요인 인 부부의주기 패턴과 같은 요인을 고려하지 않기 때문입니다.
Aksakal

순수한 통계를 넘어 다른 요인을 고려하기 전에 수학을 시작하지 않은 것을 기쁘게 생각합니다
TheBlastOne

8

내가 가장 좋아하는 책의 표지는 현재까지의 출생을 균등하게 할당한다는 가정에 대한 매우 관련성이 높은 증거를 제공합니다. 특히 1970 년 이후 미국의 출생은 서로에 겹쳐지는 몇 가지 추세를 보여줍니다. 섹션을 사용하면 생년월일을 효과적으로 예약 할 수 있으며 의사는 휴일에 일을하지 않는 경우가 많습니다) 결과적으로 1 년 동안 무작위로 선택한 날에 태어날 확률은 일정하지 않으며, 출생률이 해마다 다르기 때문에 모든 해가 똑같이 될 가능성도 없습니다.

또한 Asksal의 솔루션은 매우 강력한 경쟁자이지만 불완전하다는 증거도 제공합니다. Asksal의 추정이되도록 윤년 일의 소수, 여기 놀이에 영향 떨어져 모두에 의해 "오염"될 것입니다 또한 (아주 우연히) 일 주-의 장기 추세의 효과 촬영 과 함께 2 월 (29) 효과. 포함하기에 적합하지 않은 효과는 질문에 의해 명확하게 정의되지 않습니다.

그리고이 분석은 미국에만 국한되며 인구 통계 학적 경향은 다른 국가 나 인구와는 상당히 다를 수 있습니다. 예를 들어, 일본의 출생률은 수십 년 동안 감소하고 있습니다. 중국의 출생률은 국가에 의해 규제되며, 국가의 성별 구성과 그에 따른 후속 세대의 출생률에 영향을 미칩니다.

마찬가지로 Gelman의 분석은 최근 수십 년에 대한 설명 일 뿐이며, 이것이 귀하의 질문에 관심이있는 시대라는 것은 분명하지 않습니다.

여기에 이미지 설명을 입력하십시오

이런 종류의 것에 대해 흥분하는 사람들을 위해, 표지의 재료는 가우시안 프로세스 장에서 길게 논의됩니다.


2
사용 된 모델에 대한 간단한 설명은 블로그 게시물 ( andrewgelman.com/2012/06/19/)
Sakari Cajanus

3

2 월 29 일은 매년 4 의 배수 인 날짜입니다 .

그러나 100의 배수이지만 400 중 하나가 아닌 연도는 윤년으로 간주되지 않습니다 (예 : 1900은 윤년이 아닌 반면 2000 또는 1600은 연도). 따라서 현재는 400 년마다 같은 패턴입니다.

[0; 400 [ 간격으로 수학을 해봅시다 :

400 년 기간에, 정확히이 4 × 25 = 100 의 배수 년 4 . 그러나 우리는 100에서 3 (100의 배수이지만 400이 아닌) 을 빼야하며 100-3 = 97 년이됩니다.

이제 우리는 곱하기 97 (366)에 의해이, 97 X 366 = 35502 (400 년 기간에 윤년의 날짜 수)가 남아 (365 × (400-97)를) = 110 595 '때로 믿을 일 (수 400 년 동안 윤년에 t).

그런 다음 400 년 동안 총 일수를 알기 위해이 두 숫자를 추가해야합니다 : 110 595 + 35502 = 146 097 .

끝으로, 우리의 확률은 400 년 기간의 2 월 29 일의 수입니다. 따라서 97 윤년이 구간의 총 일수로 나눈 값은 97입니다.

p = 97/146097 ≈ 0,0006639424492

이것이 옳고 분명하기를 바랍니다.


7
이것은 무작위로 선택된 날짜가 2 월 29 일일 가능성에 대한 훌륭한 분석입니다. 나는이 글에서 대부분의 논의가 이것이 실제로 생길 가능성에 관한 질문에 대답하지는 않는다는 사실에 초점을 맞추고 있다고 생각한다.
whuber

1
훨씬 쉬운 방법은 이미 운동 한 방식으로 400 년마다 97 년의 윤년이 있다고 말하는 것입니다. 400 년 동안의 일수를 계산하십시오. 400 * 365 = 146000. 그런 다음 146097을주는 97 윤일을 추가해야합니다.
CJ Dennis

2

나는 여기에 두 가지 질문이 섞여 있다고 생각합니다. 하나는 "어느 날이 2 월 29 일일 확률은?"입니다. 두 번째는 "그리고 실제로 묻습니다"는 "도약 당일에 태어날 확률은 얼마입니까?"입니다.

Aksakal이 지적한 것처럼 단순히 일을 세는 접근법은 오도 된 것처럼 보입니다. 2 월 29 일 발생 횟수를 계산하고 빈도를 계산하면 "어느 날이 2 월 29 일일 확률은 얼마입니까?" (코마 후에 깨어나고 어떤 날인지 실마리가 없다고 상상해보십시오. 2 월 29 일이 될 확률은 이상으로 지적됩니다p=971460970,00066394

3149740097400143=6796001.131667

01


2
Errr, 나는 이것을 표결 할 준비가되어 있었다. 그리고 나는 이미 태어났다면 누구나 쉽게 할 수있다. 0 또는 1입니다 .
mattdm

나는 이것이 확률의 해석에 약간 달려 있다고 생각한다. 내가 동전을 뒤집 었다고 가정하자. 나는 그것을보고 결과 (예 : 머리)를 알고 있습니다. 당신은 내 옆에 서 있지만 결과를 보지 못했습니다. 동전이 머리를 보여줄 확률은 얼마입니까 (당신을 위해, "객관적으로") 위의 예에서 : 주어진 (태어난) 사람의 경우 확률은 0 또는 1입니다 (어떤 날짜에 태어 났는지 알고 있다고 가정). 무작위로 사람을 선택하고 그의 생일을 추측해야한다면, 2 월 29 일이 될 확률은 다시 경험적 질문입니다.
data_enthusiast

1

위의 답변 중 대부분은 특정 기간의 윤일 수를 계산 하여이 작업을 수행하는 것으로 나타났습니다. 정의에 따라 100 % 정확하게 답변을 얻는 더 간단한 방법이 있습니다.

윤년을 사용하여 일반 (365 일) 달력을 평균 열대 연도 (일명 ​​평균 태양 연도)로 조정합니다. 평균 열대 년은 "지구에서 볼 때 태양이 계절주기에서 같은 위치로 돌아 오는 데 걸리는 시간"(Wikipedia)입니다. 열대 년은 약간 다르지만 평균 (평균) 열대 년은 365.24667입니다.

도약 일이 정확하면 임의로 선택한 날이 도약 일 가능성은 ((열년)-(비연도)) / 열대 년입니다.

우리가 가진 대략적인 숫자를 연결하면 (365.24667-365) /365.24667, 또는 0.24667 / 365.24667 또는 675 / 백만 (0.0675 %)입니다.

그러나 이것은 무작위로 선택한 날입니다. "실제 생일은 4 년에 한 번만 나온다"고 자녀들에게 설명 할 필요가없는 부모들에 의해 이것은 크게 왜곡 된 것 같습니다.


3
2 월 29 윤일 은 특정 달력 시스템에만 존재 하기 때문에 이것이 질문에 대한 답으로 생각하지 않습니다 . 이러한 달력 시스템은 최근 역사적 시대에 특정 사회에서만 사용되었습니다. 예를 들어,이 질문은 "2 월"이 전혀없는 히브리 달력을 사용하여 시간을 허비 한 사람에게는 알 수 없습니다! 또한 윤년이있는 달력을 가정하더라도 생년월일의 확률 분포를 둘러싼 불확실성을 해결하지 못합니다.
Sycorax는 Reinstate Monica

@ user777, 그건 관련이 없습니다. 당신은 윤일 인식하지 못하는 문화에 속하는 경우, 아직에 태어난 사람들이있을 것입니다 우리의 도약 날.
Octopus

1
@Octopus 1582 년 10 월 이전에 태어났다면 그레고리력이 소개 된 달이 아닙니다. 이 질문은 어떤 인구가 고려되고 있는지 식별 할 수있을 정도로 구체적이지 않기 때문에 내 의견이 결정적으로 중요합니다.
Sycorax는

@ user777, 머리카락을 나누고 있습니다. 요점은 오늘날 그레고리오 력이 존재하며, 그 당시 그것을 관찰했는지 여부에 관계없이 매일 매일 역사에 배치하는 데 사용될 수 있습니다.
Octopus

1
@Octopus 요점을 어떻게 알 수 있습니까?
Sycorax는

-4

나는 2 월 29 일인 언니에게 물었고, 그녀는 "나 자신의 경험적 연구의 결과는 분명히 1.00이었다"고 말했다.


글쎄, 그것은 감사하지 않은 것 같습니다. 유명한.
John Smith
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.