오늘이 도약 일이라는 점을 감안할 때 누군가 도약 당일에 태어날 확률을 알고 있습니까?
오늘이 도약 일이라는 점을 감안할 때 누군가 도약 당일에 태어날 확률을 알고 있습니까?
답변:
확실한. 자세한 설명은 http://www.public.iastate.edu/~mlamias/LeapYear.pdf를 참조하십시오 .
그러나 본질적으로 저자는 "2 천년에 485 년의 윤년이있다. 따라서 2 천년에 일이있다. 그 중 2 월 29 일은 그 중 485 개 (윤년)이므로 확률은 "485 / 730,485 = 0.0006639424
통계를 사용하여 확률을 정확하게 예측하려면 출생 위치를 아는 것이 도움이 될 것입니다.
이 페이지 http://chmullig.com/2012/06/births-by-day-of-year/ 에는 하루의 출생 수의 하위 집합 (29에 4를 곱한 값이 잘못되어 바람직하지 않음)이있는 그래프가 있습니다. 이 질문에 대한 답변이지만 미국의 원본 데이터와 연결되어 있으며 예상되는 결과를 대략적으로 보여줍니다. 나는이 곡선이 다른 국가, 특히 다른 대륙에서는 그렇지 않다고 가정합니다. 특히 남반구와 적도 지역은 기후가 결정적인 요인이라고 가정 할 때 이러한 결과로부터 실질적인 도출을 보여줄 수 있습니다.
또한, "선택적인 출생"( http://bmjopen.bmj.com/content/3/8/e002920.full 의 저자가 다루는) 문제가 있습니다 -지구의 빈곤 한 지역에서는 다른 것을 기대할 것입니다 (비 응급-) 제왕 절개 또는 유발 된 출산이 선진국보다 드물기 때문에 출생 분포. 이것은 출생의 최종 분포를 왜곡합니다.
미국 데이터를 사용하여 2 월 29 일 ~ 71 백만 ~ 출생 (거의 평균 * 366) 및 46.000 건을 가정하고 정확한 기간이 표시되지 않기 때문에 데이터에 윤년 분포를 수정하지 않음 약 ~ 0.000648. 이것은 평평한 출생 분포를 감안할 때 예상되는 값보다 약간 낮으므로 그래프의 일반적인 인상과 일치합니다.
나는이 대략적인 추정에 대한 중요성 테스트를 동기 부여 독자들에게 맡길 것이다. 그러나 29 일 (수정되지 않았지만-2000 년에 데이터에 대한 평균 편향을 주입 함)은 이미 낮은 2 월 표준에서도 낮은 점수를 받았다는 점을 감안할 때, 등분 포의 귀선 이완증이 기각 될 수 있다는 비교적 높은 신뢰를 가정합니다.
이 질문에 대한 답은 경험적 일 뿐이라고 생각합니다. 생일 선택 현상, 계절성 등을 설명하지 않으면 이론적 대답에 결함이있을 수 있습니다. 이론적으로 다루기가 불가능합니다.
개인 정보 보호를 위해 생일 데이터는 미국에서 찾기가 어렵습니다. 여기에 익명의 데이터 세트가 있습니다 . 미국의 보험 응용 프로그램에서 가져 왔습니다. 자주 인용되는 NYT 기사 와 같은 다른 보고서와의 차이점은 1 년의 단순한 순위 대신 날짜별로 출생 빈도를 나열한다는 것입니다. 약점은 물론 보험에서 비롯된 샘플링 편향입니다. 무보험 자 등은 포함되지 않습니다.
데이터에 따르면, 총 481040 년 2 월 29 일에 325 건의 출생이있었습니다. Roy Murphy 에 따르면 이 샘플은 1981 년부터 1994 년까지 걸렸습니다. 총 14 년의 3 윤년이 포함됩니다. 조정이 없으면 1981 년에서 1994 년 사이 2 월 29 일에 태어난 확률 은 0.0675 %입니다.
윤년의 빈도를 고려하여 확률을 조정할 수 있습니다 . 예를 수치에 를 곱하여 0.079 % 추정치에 도달하는 등 1/4에 가깝습니다 ( 정확하지는 않음 ) . 여기서 윤년에 2 월 29 일에 태어난 조건부 확률 는 표본에서 윤년 의 주파수 에 의해 관측 된 주파수 와 연결됩니다 . 여기서 는 표본의 년 수이며, 은 총 출생 빈도입니다.(P) F에서 O = 325 F에서 L = 3 F O = F L / N ⋅ F ⋅ P , N = 14 F = 481,040
일반적으로 윤년 확률은 이므로 2 월 29 일에 태어난 장기 평균 확률 은 다음과 같습니다. P L P L = P는 L ⋅ P ≈ P는 L ⋅ N
윤년에 태어났다는 가정하에 2 월 29 일에 태어난 조건부 확률 에 관심이있을 수 있습니다 . p = N
따라서 과 의 연결은 몇 가지 가정을 기반으로합니다. 예를 들어 주어진 연도에 태어날 확률은 일정하고 변경되지 않습니다. p
물론이 논의는 미국 중심이었다. 다른 나라의 패턴이 무엇인지 아는 사람.
업데이트 : OP는 그레고리력이라고 자동 가정했습니다. 윤년이 30 년 정도 되는 음력 Hijri 와 같은 다른 달력을 고려하면 훨씬 더 흥미로워집니다 .
업데이트 2 :
놀라운 것은 추정 된 확률 가이 샘플에 대해 2 월 29 일에 예상되는 생일 발생을 초래한다는 것입니다 : . 이것은 1 월 1 일과 12 월 25 일보다 낮으며 NYT의 위 순위와 일치합니다! 데이터 소스 만 설명하지 않고을 참조 하지만 동일하거나 결과가 강력합니다.F ⋅ p = 1 , 527Amitabh Chandra, Harvard University
자, 그레고리력의 달력에서 1 월 1 일, 12 월 25 일, 뎁 29 일이 가장 인기있는 생일이 될 확률은 얼마나 될까요? 나는 그것이 무작위로 일어날 가능성이 거의 없다고 말합니다. 따라서 Hijri와 같은 다른 캘린더에서 무슨 일이 일어나고 있는지 보는 것이 훨씬 더 흥미 롭습니다.
업데이트 3 :
참고 둘 것을 순진 이론 예상보다 높은 :
P의 L≈P⋅366
업데이트 4 :
벤 밀우드 (Ben Millwood)는 해마다 출생 분포가 일정하지 않다고 언급했다. 이 진술을 시험해 볼 수 있습니까? 내 데이터 세트를 사용 하여 분포가 균일하다는 귀무 가설로 이론적 분포에 대해 테스트 를 실행할 수 있습니다 . 결과는 기각입니다. 즉 분포가 균일하지 않은 것 같습니다.
이론적 분포는 다음과 같습니다. 우리는 생년월일이 모든 역일에 걸쳐 일정하다고 가정합니다. 즉 14 년 동안 일에 걸쳐 있습니다. 그런 다음 일 수를 366 일로 늘립니다. 분명히 3 일의 윤일과 14 일의 비 윤일이 발생했습니다. 아래는 이론적 및 경험적 비교를위한 MATLAB 코드와 분포도입니다.
d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs
idL = 60; % index of Feb 29
% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days
fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;
fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))
% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on
% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)
산출:
non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000
h =
1
p =
0
내가 가장 좋아하는 책의 표지는 현재까지의 출생을 균등하게 할당한다는 가정에 대한 매우 관련성이 높은 증거를 제공합니다. 특히 1970 년 이후 미국의 출생은 서로에 겹쳐지는 몇 가지 추세를 보여줍니다. 섹션을 사용하면 생년월일을 효과적으로 예약 할 수 있으며 의사는 휴일에 일을하지 않는 경우가 많습니다) 결과적으로 1 년 동안 무작위로 선택한 날에 태어날 확률은 일정하지 않으며, 출생률이 해마다 다르기 때문에 모든 해가 똑같이 될 가능성도 없습니다.
또한 Asksal의 솔루션은 매우 강력한 경쟁자이지만 불완전하다는 증거도 제공합니다. Asksal의 추정이되도록 윤년 일의 소수, 여기 놀이에 영향 떨어져 모두에 의해 "오염"될 것입니다 또한 (아주 우연히) 일 주-의 장기 추세의 효과 촬영 과 함께 2 월 (29) 효과. 포함하기에 적합하지 않은 효과는 질문에 의해 명확하게 정의되지 않습니다.
그리고이 분석은 미국에만 국한되며 인구 통계 학적 경향은 다른 국가 나 인구와는 상당히 다를 수 있습니다. 예를 들어, 일본의 출생률은 수십 년 동안 감소하고 있습니다. 중국의 출생률은 국가에 의해 규제되며, 국가의 성별 구성과 그에 따른 후속 세대의 출생률에 영향을 미칩니다.
마찬가지로 Gelman의 분석은 최근 수십 년에 대한 설명 일 뿐이며, 이것이 귀하의 질문에 관심이있는 시대라는 것은 분명하지 않습니다.
이런 종류의 것에 대해 흥분하는 사람들을 위해, 표지의 재료는 가우시안 프로세스 장에서 길게 논의됩니다.
2 월 29 일은 매년 4 의 배수 인 날짜입니다 .
그러나 100의 배수이지만 400 중 하나가 아닌 연도는 윤년으로 간주되지 않습니다 (예 : 1900은 윤년이 아닌 반면 2000 또는 1600은 연도). 따라서 현재는 400 년마다 같은 패턴입니다.
[0; 400 [ 간격으로 수학을 해봅시다 :
400 년 기간에, 정확히이 4 × 25 = 100 의 배수 년 4 . 그러나 우리는 100에서 3 (100의 배수이지만 400이 아닌) 을 빼야하며 100-3 = 97 년이됩니다.
이제 우리는 곱하기 97 (366)에 의해이, 97 X 366 = 35502 (400 년 기간에 윤년의 날짜 수)가 남아 (365 × (400-97)를) = 110 595 '때로 믿을 일 (수 400 년 동안 윤년에 t).
그런 다음 400 년 동안 총 일수를 알기 위해이 두 숫자를 추가해야합니다 : 110 595 + 35502 = 146 097 .
끝으로, 우리의 확률은 400 년 기간의 2 월 29 일의 수입니다. 따라서 97 윤년이 구간의 총 일수로 나눈 값은 97입니다.
p = 97/146097 ≈ 0,0006639424492
이것이 옳고 분명하기를 바랍니다.
나는 여기에 두 가지 질문이 섞여 있다고 생각합니다. 하나는 "어느 날이 2 월 29 일일 확률은?"입니다. 두 번째는 "그리고 실제로 묻습니다"는 "도약 당일에 태어날 확률은 얼마입니까?"입니다.
Aksakal이 지적한 것처럼 단순히 일을 세는 접근법은 오도 된 것처럼 보입니다. 2 월 29 일 발생 횟수를 계산하고 빈도를 계산하면 "어느 날이 2 월 29 일일 확률은 얼마입니까?" (코마 후에 깨어나고 어떤 날인지 실마리가 없다고 상상해보십시오. 2 월 29 일이 될 확률은 이상으로 지적됩니다
위의 답변 중 대부분은 특정 기간의 윤일 수를 계산 하여이 작업을 수행하는 것으로 나타났습니다. 정의에 따라 100 % 정확하게 답변을 얻는 더 간단한 방법이 있습니다.
윤년을 사용하여 일반 (365 일) 달력을 평균 열대 연도 (일명 평균 태양 연도)로 조정합니다. 평균 열대 년은 "지구에서 볼 때 태양이 계절주기에서 같은 위치로 돌아 오는 데 걸리는 시간"(Wikipedia)입니다. 열대 년은 약간 다르지만 평균 (평균) 열대 년은 365.24667입니다.
도약 일이 정확하면 임의로 선택한 날이 도약 일 가능성은 ((열년)-(비연도)) / 열대 년입니다.
우리가 가진 대략적인 숫자를 연결하면 (365.24667-365) /365.24667, 또는 0.24667 / 365.24667 또는 675 / 백만 (0.0675 %)입니다.
그러나 이것은 무작위로 선택한 날입니다. "실제 생일은 4 년에 한 번만 나온다"고 자녀들에게 설명 할 필요가없는 부모들에 의해 이것은 크게 왜곡 된 것 같습니다.
나는 2 월 29 일인 언니에게 물었고, 그녀는 "나 자신의 경험적 연구의 결과는 분명히 1.00이었다"고 말했다.