계층 적 데이터에서 부트 스트랩 신뢰 구간 획득 및 해석


10

이 수량이 10 명씩 10 번씩 측정 될 때 수량 X에 대한 부트 스트랩 신뢰 구간을 얻는 데 관심이 있습니다.

한 가지 방법은 개인마다 평균을 구한 다음 평균을 부트 스트랩하는 것입니다 (예 : 대체 수단으로 평균을 재 샘플링).

또 다른 방법은 부트 스트래핑 절차의 각 반복에 대해 다음을 수행하는 것입니다. 각 개인 내에서 해당 개인의 10 개 관측 값을 교체하여 다시 샘플링 한 다음 해당 개인에 대한 새로운 평균을 계산 한 다음 새로운 그룹 평균을 계산합니다. 이 접근 방식에서, 원래 데이터 세트에서 관찰 된 각 개인은 항상 부트 스트랩 절차의 각 반복에 대한 그룹 평균에 기여합니다.

마지막으로, 세 번째 접근법은 위의 두 가지 접근법을 결합하는 것입니다. 이 방법은 동일한 개인이 각 반복에서 그룹 평균에 곱할 수 있도록한다는 점에서 앞의 방법과 다릅니다. 그러나 각 기여는 독립적 인 리샘플링 절차를 통해 생성되기 때문에 이러한 기여는 서로 약간 다를 수 있습니다.

실제로, 이러한 접근법은 신뢰 구간에 대한 다른 추정치를 산출한다는 것을 발견했습니다 (예 : 하나의 데이터 세트의 경우 세 번째 접근법은 처음 두 접근법보다 훨씬 더 큰 신뢰 구간을 생성한다는 것을 알았습니다). 대표하는 것으로 해석되었습니다.

답변:


7

첫 번째 접근 방식은 S CI 간입니다. S 내에서 측정하려면 잘못된 접근 방식입니다.

두 번째 접근 방식은 10 명의 개인에게만 적용되는 S CI 내부를 생성합니다.

마지막 접근 방식은 S CI 내에서 올바른 방법입니다. CI가 증가하면 CI가 10S 대신 인구에 적용될 수있는 CI를 더 많이 대표하기 때문입니다.


6

Davison and Hinckley ( "부트 스트랩 방법 및 응용 프로그램", 1997, 섹션 3.8)에 따르면 세 번째 알고리즘은 보수적입니다. 그들은 단순히 주제를 리샘플링하는 네 번째 접근법을 옹호합니다.


1
흥미롭게도, 그 참조를 찾아봐야합니다. "네 번째"접근을 의미합니까? 내가 나열한 첫 번째 접근 방식은 "주제를 간단히 리샘플링"하는 것으로 보입니다.
마이크 로렌스

1
네, 그렇습니다. 그러나 그것은 주제 수단의 리샘플링을 설명합니다. D & H는 주제를 리샘플링하고 원래 모델에 적합하도록 옹호합니다.
앤드류 로빈슨

2
최근에 출판 된 Ren, Shiquan, Lai, Hong, Tong, Wenjing, Aminzadeh, Mostafa, Hou, Xuezhang 및 Lai, Shenghan (2010) '계층 적 데이터를위한 비모수 적 부트 스트래핑', Applied Statistics Journal, 37 : 9, 1487 — 1498
앤드류 로빈슨

2
@Mike : 전체 clsuter를 리샘플링하는 것은 통계 학자들이 부트 스트랩에서하는 일입니다. 그것은 (i) 평균 만 추정하고, (ii) 데이터의 가중치가없고 균형이 잡힌 경우 "첫 번째"접근 방식과 동등한 다른 절차입니다. citeulike.org/user/ctacmo/article/1334050 , citeulike.org/user/ctacmo/article/1475866 , citeulike.org/user/ctacmo/article/582039 도 참조하십시오 .
StasK
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.