모집단의 표본 (크기 250)이 있습니다. 나는 인구 분포를 모른다.
주요 질문 : 나는 하나의 점 추정 할 일의 인구의 -percentile을 한 다음 내 포인트 추정치 약 95 %의 신뢰 구간을합니다.
나의 점 추정치는 샘플 1이됩니다 번째 -percentile. 나는 그것을 라고 표시한다 .
그런 다음 점 추정치 주변의 신뢰 구간을 구축하려고합니다. 부트 스트랩을 사용하는 것이 이치에 맞는지 궁금합니다. 나는 부트 스트랩에 매우 경험이 없으므로 적절한 용어 등을 사용하지 않으면 사면합니다.
내가 그것을 시도한 방법은 다음과 같습니다. 원래 샘플에서 1000 개의 무작위 샘플을 대체하여 그립니다. 나는 1 얻기 번째 그들 각각에서 -percentile을. 따라서 나는 1000 포인트가 - "1 일이 -percentiles". 이 1000 점의 경험적 분포를 봅니다. 의 평균을 나타냅니다 . 다음과 같이 "바이어스"를 나타냅니다. . I는 2.5 취할 번째 -percentile 97.5 번째 I는 (1) 약 95 %의 신뢰 구간 부르는 1000 점의 백분위 낮은 그리고 높은 끝을 얻었다 성을 원래 샘플 -percentile. 이 점을 및 냅니다.
마지막 남은 단계는 1 주위에있을이 신뢰 구간을 적용하는 일 의 -percentile 인구 1보다는 주위에 일 의 -percentile 원래 샘플 . 따라서 를 하단으로, 을 상단으로 사용합니다. 모집단의 1 번째 백분위 수 점 추정치 주변의 95 % 신뢰 구간의 이 마지막 간격은 내가 찾던 것입니다.
중요한 점은, 내 의견으로는, 그것은 1 사용 부트 스트랩에 의미가 여부 번째 오히려 가까운 인구의 알 수없는 기본 분포의 꼬리입니다 -percentile. 문제가 될 것 같습니다. 최소 (또는 최대) 주위에 신뢰 구간을 구축하기 위해 부트 스트랩을 사용하는 것을 고려하십시오.
그러나 아마도이 접근법에 결함이 있습니까? 알려주세요.
편집하다:
경험적 1 : 조금 더 문제에 대해 생각을 갖는, 내 솔루션은 다음을 의미 볼 일을 원래의 샘플의 백분위 1의 바이어스 추정 할 수있다 일을 인구의 백분율. 그렇다면 포인트 추정값은 바이어스 조정되어야합니다 : . 그렇지 않으면 바이어스 조정 된 신뢰 구간은 바이어스 조정되지 않은 포인트 추정치와 호환되지 않습니다. 점 추정치와 신뢰 구간을 모두 조정하거나 전혀 조정하지 않아야합니다.
반면에, 추정값이 바이어스되는 것을 허용하지 않으면 바이어스 조정을 수행 할 필요가 없습니다. 즉, 를 점 추정치로 사용하고 를 하단으로, 을 95 %의 상단으로 사용합니다. 신뢰 구간. 이 간격이 의미가 있는지 확실하지 않습니다 ...
그래서 어떤 의미가 샘플 한 것으로 가정 할 수 있도록 않는 번째 백분위 수는 인구 1의 바이어스 추정치이다 번째 백분위? 그렇지 않은 경우 대체 솔루션이 올바른가요?