부트 스트랩 샘플이 원래 샘플과 정확히 동일한 확률


9

추론을 확인하고 싶습니다.

원래 샘플의 크기가 이고 부트 스트랩 인 경우 다음과 같이 생각합니다.n

1n 은 원래 샘플에서 관찰 된 관측치입니다. 다음 추첨이 이전에 샘플링 된 관측치가 아닌지 확인하기 위해 표본 크기를 로 제한합니다 . 따라서이 패턴을 얻습니다.n1

1n1n11n21n(n1)=1n!.

이 올바른지? 나는 왜 대신 (\ frac {1} {n}) ^ n이 될 수 없는지에 대해 비틀 거렸다 (1).


1
내가 당신을 따르고 있는지 확실하지 않습니다. "다음 추첨이 이전 샘플이 아닌지 확인"하고 싶은 이유는 무엇입니까? 부트 스트랩에서 아이디어는 대체품으로 샘플링하는 것입니다. 즉,이다 할 수 는 다음 무승부 이미 그려 한 것과 동일 가능성이되고 싶어요.
gung-복직 모니카

그러나 이것이 부트 스트랩 된 샘플이 원래 샘플과 동일하지 않다는 것을 의미하지 않습니까?
Jayant.M

나는 당신을 따르지 않습니다. 반드시 부트 샘플을 샘플과 동일하게 만들 필요는 없으며 샘플을 모집단의 모델로 취급하기 만하면됩니다.
gung-모니 티 복원

1
그래서 제 질문은 부트 스트랩 샘플이 원래 샘플과 동일 할 가능성은 무엇입니까? 나는 부트 스트랩이 샘플과 동일하다는 것에 관심이있다
Jayant.M

내 질문이 명확하지 않은 경우 죄송합니다!
Jayant.M

답변:


17

각 관측 위치 ( )에서 관측치 중 하나를 선택할 수 있으므로 개가 가능한 재 샘플링 (그리기 순서를 유지함)이"동일한 샘플"입니다 (예 : 반복없이 원래 관측 값을 모두 포함합니다 . 이는 처음 시작한 샘플을 정렬하는 모든 방법을 설명합니다).나는=1,2,...,!

예를 들어, a, b 및 c라는 세 개의 관측치로 27 개의 가능한 샘플이 있습니다.

aaa aab aac aba abb abc aca acb acc 
baa bab bac bba bbb bbc bca bcb bcc 
caa cab cac cba cbb cbc cca ccb ccc 

그 중 6 개에는 a, b 및 c가 각각 하나씩 있습니다.

따라서 은 원래 샘플을 되 찾을 확률입니다.!/

옆으로-확률의 빠른 근사치 :

고려 것을 :

2π +12이자형!이자형 +12이자형

그래서

2π 12이자형!/이자형 12이자형

하한은 스털링 근사에 대해 일반적으로 주어진 것입니다 (큰 대한 상대 오차가 낮습니다 ).

[Gosper 사용 하도록 제안했습니다 근사 수득 것 이 확률에 대한 이는 기준이 얼마나 엄격한 지에 따라 또는 로 적절하게 작동합니다 .]!(2+1)π이자형(2+1)π이자형==1


(의견에 대한 답변 :) 주어진 재 샘플에서 특정 관측 값을 얻지 못할 확률은 이며 큰 경우 대략 입니다.(11)이자형1

자세한 내용은 평균적으로 각 부트 스트랩 샘플에 대략 2/3의 관측치가 포함되는 이유 를 참조하십시오
.


감사합니다! 관심의 대상으로 샘플에서 특정 항목을 얻지 못할 가능성은 무엇입니까? 예를 들어 당신이 준 의 분포 와 함께,,,
Jayant

1
그것은 이미 사이트의 다른 답변에서 다루었지만 위의 (간결하게) 추가했습니다.
Glen_b-복지 모니카

1
따라서 이것은 원래 샘플의 순열 인 샘플을 얻을 확률입니다. 대신 원래 샘플에서와 정확히 동일한 순서를 얻을 확률 (따라서 동일한 순서로 동일한 요소)은 입니다. 권리? (1)
DeltaIV

1
@deltaiv 예, 중 하나만준비는 원래 순서대로되어 있습니다. !
Glen_b-복지 주 모니카

1
Gosper의 근사값은 =1아래로만 =? 0.499라고 생각합니다=2)는 0.5와 0.996에 대한 근사값입니다. =1)도 1.0에 매우 가깝습니다.
Karl Ove Hufthammer
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.