시계열 데이터로 부트 스트랩을 어떻게 수행합니까?


33

최근에 부트 스트래핑 기술을 사용하여 추정기의 표준 오류 및 신뢰 구간을 계산하는 방법에 대해 배웠습니다. 내가 배운 것은 데이터가 IID 인 경우 샘플 데이터를 모집단으로 취급하고 대체 샘플링을 수행 할 수 있으므로 테스트 통계에 대한 여러 시뮬레이션을 얻을 수 있습니다.

시계열의 경우 자기 상관이 존재할 가능성이 있기 때문에이를 수행 할 수 없습니다. 시계열이 있고 고정 날짜 전후의 데이터 평균을 계산하고 싶습니다. 부트 스트랩의 수정 된 버전을 사용하는 올바른 방법이 있습니까?


16
주요 검색어 : 블록 부트 스트랩.
추기경

답변:


26

@ cardinal이 지적했듯이 '블록 부트 스트랩'의 변형은 자연스러운 접근 방식입니다. 여기에, 방법에 따라, 당신은 중복 여부 및 샘플 (의 정상 성을 보장 할 수 고정 길이 또는 랜덤 중 하나, 시계열의 뻗어을 선택 1991 Politis와 로마노, 다음, 다시 샘플링 시간 시리즈를 만들어 함께 다시 스티치) 통계를 계산합니다. 또한 시간 종속 모델을 작성하여 Markov 방법, 자동 회귀 체 등을 만들 수 있습니다. 그러나 블록 부트 스트랩은 아마도 이러한 방법 중 가장 쉬운 방법 일 것입니다.

Gonçalves and Politis (2011) 는 참고 문헌으로 매우 짧은 검토입니다. 책 길이 처리는 Lahiri (2010) 입니다.


@statnub 이전의 주간 영업 개입 질문과 관련이있는 경우 배포 한 모델 가정을 신뢰하지 않으면 부트 스트랩됩니다. 처음에 정당한 시계열 모델을 사용하면 이상적으로 부트 스트랩의이 종류를 나타냅니다 사물의 위험 ... 최소화한다
conjugateprior

6
좋은 대답입니다. 이 작업을 수행하기 위해 R tsbootboot패키지에서 사용할 수 있다고 추가하겠습니다 .
MånsT

@ MånsT 니스. 나는 그 패키지에 대해 몰랐다.
켤레

5

x1,···,xnx1,x2,···,xn

모델 기반 리샘플링은 시계열에 쉽게 적용됩니다. 리 샘플은 시계열 모델을 시뮬레이션하여 얻습니다. 예를 들어, 모형이 ARIMA (p, d, q) 인 경우 자동 회귀 및 이동 평균 계수와 노이즈 분산의 MLE (차이 계열)을 사용하여 ARIMA (p, q) 모델을 다시 샘플링합니다. 리 샘플은 시뮬레이션 된 ARIMA (p, q) 프로세스의 부분 합 시퀀스입니다.

시계열의 모델이없는 리샘플링은 블록 부트 스트랩이라고도하는 블록 리샘플링으로 이루어지며, R 부트 패키지에서 tsboot 함수를 사용하여 구현할 수 있습니다. 아이디어는 시리즈를 대략 동일한 길이의 연속 관측치 블록으로 나누고 블록을 교체하여 다시 샘플링 한 다음 블록을 함께 붙여 넣는 것입니다. 예를 들어 시계열의 길이가 200이고 길이가 20 인 10 개의 블록을 사용하는 경우 블록은 처음 20 개의 관측치, 다음은 20 개 등입니다. 가능한 재 샘플은 네 번째 블록 (관측 61 ~ 80), 마지막 블록 (관측 181 ~ 200), 두 번째 블록 (관찰 21 ~ 40), 다시 네 번째 블록 등입니다. 리 샘플에서.


1
Lahiri (2003)의 책 "종속 데이터 리샘플링 방법"에 자세히 설명되어있는 중복 블록 부트 스트랩 및 원형 블록 부트 스트랩을 포함한 다른 형태의 블록 부트 스트랩 방법이 있습니다. 이러한 방법은 고정 시계열에 적용 할 수 있습니다.
Michael R. Chernick
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.