추론을 확인하고 싶습니다.
원래 샘플의 크기가 이고 부트 스트랩 인 경우 다음과 같이 생각합니다.
은 원래 샘플에서 관찰 된 관측치입니다. 다음 추첨이 이전에 샘플링 된 관측치가 아닌지 확인하기 위해 표본 크기를 로 제한합니다 . 따라서이 패턴을 얻습니다.
이 올바른지? 나는 왜 대신 (\ frac {1} {n}) ^ n이 될 수 없는지에 대해 비틀 거렸다 .
추론을 확인하고 싶습니다.
원래 샘플의 크기가 이고 부트 스트랩 인 경우 다음과 같이 생각합니다.
은 원래 샘플에서 관찰 된 관측치입니다. 다음 추첨이 이전에 샘플링 된 관측치가 아닌지 확인하기 위해 표본 크기를 로 제한합니다 . 따라서이 패턴을 얻습니다.
이 올바른지? 나는 왜 대신 (\ frac {1} {n}) ^ n이 될 수 없는지에 대해 비틀 거렸다 .
답변:
각 관측 위치 ( )에서 관측치 중 하나를 선택할 수 있으므로 개가 가능한 재 샘플링 (그리기 순서를 유지함)이"동일한 샘플"입니다 (예 : 반복없이 원래 관측 값을 모두 포함합니다 . 이는 처음 시작한 샘플을 정렬하는 모든 방법을 설명합니다).
예를 들어, a, b 및 c라는 세 개의 관측치로 27 개의 가능한 샘플이 있습니다.
aaa aab aac aba abb abc aca acb acc
baa bab bac bba bbb bbc bca bcb bcc
caa cab cac cba cbb cbc cca ccb ccc
그 중 6 개에는 a, b 및 c가 각각 하나씩 있습니다.
따라서 은 원래 샘플을 되 찾을 확률입니다.
옆으로-확률의 빠른 근사치 :
고려 것을 :
그래서
하한은 스털링 근사에 대해 일반적으로 주어진 것입니다 (큰 대한 상대 오차가 낮습니다 ).
[Gosper 는 사용 하도록 제안했습니다 근사 수득 것 이 확률에 대한 이는 기준이 얼마나 엄격한 지에 따라 또는 로 적절하게 작동합니다 .]
(의견에 대한 답변 :) 주어진 재 샘플에서 특정 관측 값을 얻지 못할 확률은 이며 큰 경우 대략 입니다.
자세한 내용은 평균적으로 각 부트 스트랩 샘플에 대략 2/3의 관측치가 포함되는 이유 를 참조하십시오
.