이 샘플 의 샘플 과 부트 스트랩 샘플 이 안정적인 (예 : 평균)라고 가정합니다. 우리 모두 알고 있듯이,이 부트 스트랩 샘플 은 통계량 추정기의 샘플링 분포 를 추정 합니다 .
이제이 부트 스트랩 표본 의 평균이 원래 표본 의 통계량 보다 모집단 통계량 의 더 나은 추정치 입니까? 어떤 조건에서 그러한 상황이 발생합니까?
이 샘플 의 샘플 과 부트 스트랩 샘플 이 안정적인 (예 : 평균)라고 가정합니다. 우리 모두 알고 있듯이,이 부트 스트랩 샘플 은 통계량 추정기의 샘플링 분포 를 추정 합니다 .
이제이 부트 스트랩 표본 의 평균이 원래 표본 의 통계량 보다 모집단 통계량 의 더 나은 추정치 입니까? 어떤 조건에서 그러한 상황이 발생합니까?
답변:
문제의 핵심에 집중하기 위해 일반화합시다. 나는 가장 작은 세부 사항을 철자하여 의심 할 여지가 없습니다. 분석에는 다음이 필요합니다.
숫자 집합 z 1 , … , z m 의 산술 평균 은 다음과 같이 정의됩니다.
기대는 선형 연산자입니다. 즉, 이 임의의 변수이고 α i 가 숫자 인 경우 선형 조합에 대한 기대치는 기대치의 선형 조합입니다.
하자 샘플 수 ( B (1) , ... , B에 K ) 데이터 집합으로부터 얻어지는 X = ( X 1 , ... , X의 N ) 복용에 의한 k 값 으로부터 균일 요소 X 여분으로. m ( B ) 를 B 의 산술 평균 이라고하자 . 이것은 임의의 변수입니다. 그때
기대의 선형성에 따른다. 이후의 요소 모두 동일한 방식으로 수득되며, 모두 동일한 기대 가질 B 발언권 :
이것은 앞서 말한 것을 단순화합니다
정의에 따르면, 예상은 확률 가중 값의 합입니다. 각 값은 1 / n 의 동일한 기회 가 선택 되었다고 가정하기 때문에 ,
데이터의 산술 평균.
질문에 답하기 위해 데이터 평균 를 사용하여 모집단 평균을 추정하면 부트 스트랩 평균 ( k = n 인 경우 )도 ˉ x 와 같으 므로 모집단 평균의 추정치와 동일합니다 .
데이터의 선형 함수가 아닌 통계의 경우 동일한 결과가 반드시 유지되는 것은 아닙니다. 그러나 단순히 데이터의 통계 값 대신 부트 스트랩 평균을 대체하는 것은 잘못입니다. 이는 부트 스트랩이 작동하는 방식이 아닙니다. 대신, 부트 스트랩 평균과 데이터 통계를 비교하여 통계 의 편향 에 대한 정보를 얻습니다 . 이를 통해 원래 통계를 조정 하여 편향을 제거 할 수 있습니다 . 이와 같이, 편향 보정 된 추정치는 원래 통계와 부트 스트랩 평균의 대수 조합이된다. 자세한 내용은 "BCa"(바이어스 수정 및 가속 부트 스트랩) 및 "ABC"를 찾아보십시오. Wikipedia 는 몇 가지 참고 자료를 제공합니다.
부트 스트랩 분포는 다음과 같이 정의되어 있기 때문에 F N ( X ) = 1 부트 스트랩 분포의 평균은 E F N [ X ] = 1