저 역시 부트 스트랩과 베이 즈 정리에 유혹을 받았지만, 베이 즈 관점에서 볼 때까지 부트 스트랩의 정당화에 대해 많은 이해를 할 수 없었습니다. 그런 다음 아래에서 설명하는 것처럼 부트 스트랩 분포는 베이지안 후부 분포로 볼 수 있는데, 이는 부트 스트랩 뒤에 (a?) 근거를 분명히하고, 가정을 명확하게하는 이점을가집니다. https://arxiv.org/abs/1803.06214(22-26 페이지) 에는 아래의 주장과 가정에 대한 자세한 내용이 있습니다 .
예를 들어, http://woodm.myweb.port.ac.uk/SL/resample.xlsx 의 스프레드 시트에 설정되어있는 경우 (화면 하단의 부트 스트랩 탭 클릭) 스프레드 시트를 사용하여이 샘플을 대체하여 1000 개의 리 샘플을 생성하고 평균을 가장 가까운 짝수로 반올림했을 때이 평균의 82 개는 54 개였습니다. 부트 스트랩의 아이디어는 우리가 9의 표본 평균이 얼마나 가변적 일지 알기 위해 표본을 "척수"모집단으로 사용하므로 표본 평균의 확률이 모집단 평균보다 6이 낮을 가능성이 있음을 나타냅니다 (이 경우 척도 모집단은 평균 60)의 샘플은 8.2 %입니다. 리샘플링 히스토그램의 다른 막대에 대해서도 비슷한 결론을 내릴 수 있습니다.
이제 실제 모집단의 평균이 66이라는 사실을 상상해 봅시다. 이것이 그렇다면 표본 평균이 60 (즉, 데이터) 일 확률의 추정치는 8.2 %입니다 (위 단락의 결론을 사용하여) 60은 가정 된 인구 평균 66보다 6 아래 6입니다). 이것을 다음과 같이 작성하자
P (평균 데이터 = 66) = 8.2 %
이 확률은 리샘플링 분포의 x 값 54에 해당합니다. 같은 종류의 인수는 0, 2, 4 ... 100의 가능한 모든 모집단 평균에 적용됩니다. 각 경우에 확률은 리샘플링 분포에서 비롯되지만이 분포는 평균 60에 대해 반영됩니다.
이제 베이 즈 정리를 적용 해 봅시다. 해당 측정 값은 0에서 100 사이의 값만 사용할 수 있으므로 가장 가까운 짝수로 반올림하면 모집단 평균의 가능성은 0, 2, 4, 6, .... 100입니다. 사전 분포가 평평하다고 가정하면, 이들 각각의 사전 확률은 2 % (1dp)이며 베이 즈 정리는 다음과 같이 알려줍니다.
P (PopMean = 66 주어진 데이터) = 8.2 % * 2 % / P (Data)
어디
P (데이터) = P (PopMean = 0 주어진 데이터) * 2 % + P (PopMean = 2 주어진 데이터) * 2 % + ... + P (PopMean = 100 주어진 데이터) * 2 %
이제 2 %를 취소 할 수 있으며 확률은 단순히 리샘플링 분포의 확률이므로 확률의 합은 1이어야합니다. 어느 결론은 우리에게
P (팝 평균 = 66) = 8.2 %
8.2 %는 66이 아니라 54에 대응하는 리샘플링 분포로부터의 확률이라는 것을 기억하고, 후방 분포는 단순히 샘플 평균 (60)에 대해 반영된 리샘플링 분포이다. 또한 리샘플링 분포가 비대칭이 임의라는 점에서 대칭 인 경우 (이 경우와 기타 여러 경우 에서처럼), 재 샘플 분포를 사후 확률 분포와 동일한 것으로 간주 할 수 있습니다.
이 주장은 다양한 가정을하는데, 주된 이유는 이전의 분포가 균일하다는 것입니다. 이것들은 위에서 인용 한 기사에서 더 자세하게 설명되어 있습니다.