답변:
부트 스트랩 통계는 모집단 모수에서 한 단계 더 추상화되기 때문입니다. 모집단 모수, 표본 통계량 및 부트 스트랩이있는 세 번째 계층에만 있습니다. 부트 스트랩 평균값은 모집단 모수에 대한 더 나은 추정값이 아닙니다. 추정치 일뿐입니다.
와 같이 가능한 모든 부트 스트랩 조합을 포함하는 부트 스트랩 분포는 동일한 조건에서 모집단 모수를 중심으로 한 샘플 통계 중심과 마찬가지로 샘플 통계를 중심으로합니다. 이 문서는 여기에 이러한 것들을 요약하고 내가 찾을 수있는 가장 쉬운 것 중 하나입니다. 보다 자세한 증거는 참조하는 논문을 따르십시오. 주목할만한 예는 Efron (1979) 과 Singh (1981)입니다.
의 부트 스트래핑 분포 의 분포는 다음 θ - θ 신뢰 구간의 구조 내의 샘플 추정치의 표준 오차의 추정에 유용하게, 그리고 파라미터의 바이어스를 추정한다. 모집단 모수에 대해 더 나은 추정량을 제공하지는 않습니다. 통계 분포에 대한 일반적인 모수 분포에 대한 더 나은 대안을 제공 할뿐입니다.
사람들 이 부트 스트랩 배포의 평균을 사용하는 경우가 적어도 하나 있습니다. 배깅 ( 부트 스트랩 집계의 줄임말 ).
기본 아이디어는 추정기가 데이터의 섭동에 매우 민감한 경우 (예를 들어, 추정기가 높은 분산과 낮은 바이어스를 가짐) 많은 부트 스트랩 샘플의 평균을 계산하여 특정 예의 과적 합량을 줄일 수 있다는 것입니다.
내가 링크 한 페이지는 이것이 추정에 약간의 편향을 초래한다는 것을 지적하므로 샘플 평균이 부트 스트랩 샘플을 평균화하는 것보다 더 의미가있는 이유입니다. 그러나 의사 결정 트리 또는 데이터의 작은 변화에 따라 급격히 변할 수있는 가장 가까운 이웃 분류기와 같은 것이 있다면이 편향이 과적 합만큼 큰 문제가되지 않을 수 있습니다.