최근에 부트 스트랩을 연구 한 결과, 여전히 퍼즐 문제가 있습니다.
모집단이 있고 모집단 속성 (예 : 을 알고 싶습니다 . 여기서 를 사용 하여 모집단을 나타냅니다. 이 는 예를 들어 인구 평균 일 수 있습니다. 일반적으로 모집단에서 모든 데이터를 얻을 수는 없습니다. 따라서 크기가 표본 를 그립니다.P θ X모집단에서 N 인. 단순성을 위해 iid 샘플이 있다고 가정 해 봅시다. 그런 다음 당신은 당신의 추정 얻을 θ = g ( X을 ) . 당신은 사용할 θ을 대한 추론을 할 θ 당신의 변화를 알고 싶습니다 그래서, θ를 .
첫째,이 사실 의 샘플링 분포 θ는 . 개념적으로 모집단에서 많은 표본을 추출 할 수 있습니다 (각 표본의 크기는 N입니다 ). 때마다 당신의 실현해야합니다 θ = g ( X ) 다른 샘플을 각 시간 이후입니다. 그리고 결국, 당신은 복구 할 수 사실 의 유통 θ를 . 좋아, 적어도이 분포의 추정을위한 개념 벤치 마크 θ는 . 다시 말해 보겠습니다. 궁극적 인 목표는 다양한 방법을 사용하여 실제 분포 를 추정하거나 근사화하는 것 입니다. .
자, 여기 질문이 있습니다. 일반적으로 N 개의 데이터 포인트 를 포함하는 하나의 샘플 만 있습니다 . 그럼 당신은이 샘플 여러 번에서 재 샘플링, 그리고 당신의 부트 스트랩 배포와 함께 올 것이다 θ . 내 질문은 : 가까이가이 부트 스트랩 분배 얼마나 진실 의 샘플링 분포 θ ? 그것을 정량화하는 방법이 있습니까?