항상 부트 스트랩 CI를 사용하지 않는 이유는 무엇입니까?


12

부트 스트랩 CI (및 Barticular의 BCa)가 정규 분포 데이터에서 어떻게 수행되는지 궁금합니다. 다양한 유형의 분포에서 성능을 검사하는 작업이 많지만 정규 분포 데이터에서 아무것도 찾을 수 없습니다. 먼저 공부해야 할 것이 분명해 보이므로 논문이 너무 오래되었다고 생각합니다.

R 부트 패키지를 사용하여 Monte Carlo 시뮬레이션을 수행하고 부트 스트랩 CI가 정확한 CI와 일치하는 것을 발견했지만 작은 샘플 (N <20)의 경우 약간 자유 롭습니다 (더 작은 CI). 충분히 큰 샘플의 경우 본질적으로 동일합니다.

이것은 항상 부트 스트랩을 사용 하지 않는 좋은 이유가 있는지 궁금합니다 . 분포가 정상인지 여부를 평가하기가 어렵고 그 뒤에 많은 함정이 있기 때문에 분포에 관계없이 부트 스트랩 CI를 결정하고보고하지 않는 것이 합리적입니다. 비모수 적 테스트는 전력이 적기 때문에 체계적으로 사용하지 않는 동기를 이해하지만 시뮬레이션 결과에 따르면 부트 스트랩 CI의 경우에는 해당되지 않습니다. 그들은 더 작습니다.

나를 괴롭히는 비슷한 질문은 항상 중앙값을 중심 경향의 척도로 사용하지 않는 이유입니다. 사람들은 종종 정규 분포가 아닌 데이터를 특성화하기 위해이 데이터를 사용하는 것이 좋지만, 중앙값이 정규 분포 데이터의 평균과 같기 때문에 왜 구별해야합니까? 분포가 정상인지 아닌지를 결정하기위한 절차를 제거 할 수 있다면 상당히 유익 해 보일 것입니다.

이러한 문제에 대한 귀하의 생각과 이전에 논의 된 적이 있는지 궁금합니다. 참고 문헌을 높이 평가할 것입니다.

감사!

피에르


평균 및 중앙값에 관한 내 질문을 참조하십시오 : stats.stackexchange.com/questions/96371/…
Alexis

많은 문제에서 리샘플링은 계산 상 불가능합니다. 예를 들어, 단순히 큰 3D 매트릭스 또는 긴 시계열에 대한 CI를 계산하려는 경우.
jona

답변:


4

BCa 구간의 동기와 메커니즘 (즉, "수정 계수")을 살펴 보는 것이 좋습니다. BCa 구간은 부트 스트랩 백분위 구간의보다 일반적인 경우 (즉, 부트 스트랩 분포 자체에만 의존하는 신뢰 구간)이기 때문에 부트 스트랩의 가장 중요한 측면 중 하나입니다.

특히 BCa 간격과 부트 스트랩 백분위 간격의 관계를 살펴보십시오. 가속도 조정 (첫 번째 "수정 계수")과 왜곡도 (두 번째 "수정 계수")가 모두 0이면 BCa 간격이 일반적인 부트 스트랩 백분위 간격.

나는 항상 부트 스트랩을 사용하는 것이 좋은 생각이라고 생각하지 않습니다. 부트 스트랩 핑은 다른 문제 (예 : 비정규 성)를 조정하기위한 다양한 메커니즘 (예 : 신뢰 구간 및 이질 분 산성이있을 때 와일드 부트 스트랩과 같은 여러 유형의 문제에 대해 부트 스트랩의 변형이 다름)을 가진 강력한 기술입니다. )이지만 데이터는 실제 인구를 정확하게 나타냅니다.

이 가정은 본질적으로 단순하지만 작은 표본 크기의 맥락에서 특히 확인하기 어려울 수 있습니다 (작은 표본이 실제 모집단을 정확하게 반영한다고 생각할 수 있습니다!). 부트 스트랩 배포 (및 그에 따른 모든 결과)가 정확하지 않은 원래 샘플이 정확하지 않으면 결과 (및 결과에 따른 결정)에 결함이 있습니다.

결론 : 부트 스트랩에는 많은 모호함이 있으므로 적용하기 전에주의를 기울여야합니다.


2
"부트 스트랩 분포 (따라서 그 결과로 나오는 모든 결과)가 정확하지 않은 원본 샘플은 결과 (그리고 그 결과에 따른 결정)에 결함이 있습니다." -> 그러나 부트 스트랩 CI가 분석 대안보다 성능이 좋지 않습니까?
jona

3
데이터가 모집단을 적절하게 나타내는 것으로 가정하는 것은 부트 스트랩에만 국한되지 않습니다. 일반적으로 통계와 관련이 있으므로 데이터가 부적절하면 추론, 부트 스트랩 추론 또는 그 밖의 다른 것으로 오해의 소지가 있습니다. 결론!).
mmmmmmmmmm

4
따라서이 경고는 부트 스트랩에 관한 것이 아니라 추론에 관한 것이며 다른 방법보다 부트 스트랩을 사용하는 것에 대한 주장이 아니라 오해 할 수있는 방법에 절대적인 믿음을 두는 것에 대한 논쟁입니다. 나는이 맥락에서 그것이 어떻게 관련되는지 알지 못한다.
jona 2016 년

죄송합니다,이 글타래가 조금 늦었습니다 .... @ jona : 부트 스트랩이 샘플을 더 증폭시킬 것이기 때문에 관련이 없습니까? 따라서 표본이 불행하게도 인구를 잘못 표현한 경우 부트 스트랩을 사용하면 인구 센터에서 더 멀리 떨어져 있습니까? 그것은 부트 스트래핑에 체계적으로 의존하는 것에 대한 잠재적 인 논쟁이 아닌가?
sisdog
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.