부트 스트랩을 사용하여 1 차 백분위 수의 샘플링 분포 구하기

모집단의 표본 (크기 250)이 있습니다. 나는 인구 분포를 모른다.

주요 질문 : 나는 하나의 점 추정 할 ^일의 인구의 -percentile을 한 다음 내 포인트 추정치 약 95 %의 신뢰 구간을합니다.

나의 점 추정치는 샘플 1이됩니다 ^번째 -percentile. 나는 그것을 라고 표시한다 . $x$

그런 다음 점 추정치 주변의 신뢰 구간을 구축하려고합니다. 부트 스트랩을 사용하는 것이 이치에 맞는지 궁금합니다. 나는 부트 스트랩에 매우 경험이 없으므로 적절한 용어 등을 사용하지 않으면 사면합니다.

내가 그것을 시도한 방법은 다음과 같습니다. 원래 샘플에서 1000 개의 무작위 샘플을 대체하여 그립니다. 나는 1 얻기 ^번째 그들 각각에서 -percentile을. 따라서 나는 1000 포인트가 - "1 ^일이 -percentiles". 이 1000 점의 경험적 분포를 봅니다. 의 평균을 나타냅니다 . 다음과 같이 "바이어스"를 나타냅니다. . I는 2.5 취할 ^번째 -percentile 97.5 ^번째 I는 (1) 약 95 %의 신뢰 구간 부르는 1000 점의 백분위 낮은 그리고 높은 끝을 얻었다 ^성을 원래 샘플 -percentile. 이 점을 및 냅니다. $x_{mean}$ $\text{bias}=x_{mean}-x$ $x_{0.025}$ $x_{0.975}$

마지막 남은 단계는 1 주위에있을이 신뢰 구간을 적용하는 ^일 의 -percentile 인구 1보다는 주위에 ^일 의 -percentile 원래 샘플 . 따라서 를 하단으로, 을 상단으로 사용합니다. 모집단의 1 ^번째 백분위 수 점 추정치 주변의 95 % 신뢰 구간의 이 마지막 간격은 내가 찾던 것입니다. $x-\text{bias}-(x_{mean}-x_{0.025})$ $x-\text{bias}+(x_{0.975}-x_{mean})$

중요한 점은, 내 의견으로는, 그것은 1 사용 부트 스트랩에 의미가 여부 ^번째 오히려 가까운 인구의 알 수없는 기본 분포의 꼬리입니다 -percentile. 문제가 될 것 같습니다. 최소 (또는 최대) 주위에 신뢰 구간을 구축하기 위해 부트 스트랩을 사용하는 것을 고려하십시오.

그러나 아마도이 접근법에 결함이 있습니까? 알려주세요.

편집하다:

경험적 1 : 조금 더 문제에 대해 생각을 갖는, 내 솔루션은 다음을 의미 볼 ^일을 원래의 샘플의 백분위 1의 바이어스 추정 할 수있다 ^일을 인구의 백분율. 그렇다면 포인트 추정값은 바이어스 조정되어야합니다 : . 그렇지 않으면 바이어스 조정 된 신뢰 구간은 바이어스 조정되지 않은 포인트 추정치와 호환되지 않습니다. 점 추정치와 신뢰 구간을 모두 조정하거나 전혀 조정하지 않아야합니다. $x-\text{bias}$

반면에, 추정값이 바이어스되는 것을 허용하지 않으면 바이어스 조정을 수행 할 필요가 없습니다. 즉, 를 점 추정치로 사용하고 를 하단으로, 을 95 %의 상단으로 사용합니다. 신뢰 구간. 이 간격이 의미가 있는지 확실하지 않습니다 ... $x$ $x-(x_{mean}-x_{0.025})$ $x+(x_{0.975}-x_{mean})$

그래서 어떤 의미가 샘플 한 것으로 가정 할 수 있도록 않는 ^번째 백분위 수는 인구 1의 바이어스 추정치이다 ^번째 백분위? 그렇지 않은 경우 대체 솔루션이 올바른가요?

— 리차드 하디
소스

이것은 부트 스트랩 질문을 직접 다루지는 않지만 도움이 될 수 있습니다. onlinecourses.science.psu.edu/stat414/node/231

— shadowtalker

분포의 극단에 대한 부트 스트랩 추론은 일반적으로 모호합니다. N - 아웃 - 오브 - N 부트 스트랩 할 때의 최소 또는 최대 크기의 샘플에서 , 당신은 표본 극단 관측 값을 재현 할 확률과 마찬가지로 약 두 번째 극단 관측 값을 재현 할 확률 등입니다. 꼬리에서 기본 분포의 모양과 관련이없는 결정 성 분포를 얻습니다. 또한, 부트 스트랩은 분포가이 값보다 낮은 지지력을 가지고 있어도 (최소와 같이 대부분의 연속 분포에서와 같이) 최소값 이하의 값을 줄 수 없습니다. $n$ $1 - (1-1/n)^n \sim 1 - {\rm exp}(-1) = 63.2\%$ ${\rm exp}(-1) - {\rm exp}(-2)=23.3\%$

이 솔루션은 복잡하고 극단적 인 가치 이론 의 무증상 조합 과 n 개 미만의 관측 값 보다 작은 서브 샘플링 의 조합에 의존합니다 (실제로, 더 적은 수의 비율은 만큼 0으로 수렴해야 함 ). $n\to\infty$

— StasK
소스

대답은 도움이되지만 부트 스트랩 동작과 관련하여 1 백분위 수가 최소에 얼마나 가까운 지에 대한 아이디어를 얻고 싶습니다. 매우 큰 표본에서 첫 번째 백분위 수는 최소값에서 "먼"것으로 간주 할 수 있으며 위에 나열된 문제는 무시할 수 있지만 작은 표본에서 첫 번째 백분위 수는 최소 자체이며 문제는 많이 중요합니다. 따라서 우리는 중간에 있습니다. 이 점에서 250 개의 관측치의 표본 크기는 매우 작은 것으로 간주되어야한다고 생각합니다.

— Richard Hardy