박스 젠킨스 모델 선택


14

시계열 분석에서 Box-Jenkins 모델 선택 절차는 시리즈의 자기 상관 및 부분 자기 상관 함수를 살펴 보는 것으로 시작합니다. 이러한 도표 는 ARMA 모델 에서 적절한 p 및 를 제안 할 수 있습니다 . 이 절차는 사용자에게 AIC / BIC 기준을 적용하여 화이트 노이즈 오류 항이있는 모델을 생성하는 모델 중에서 가장 포용적인 모델을 선택하도록 요청함으로써 계속됩니다.q(p,q)

이러한 육안 검사 및 기준 기반 모델 선택 단계가 최종 모델의 추정 표준 오차에 어떤 영향을 미치는지 궁금합니다. 예를 들어, 단면 도메인의 많은 검색 절차가 표준 오류를 하향 조정할 수 있다는 것을 알고 있습니다.

첫 번째 단계에서 데이터 (ACF / PACF)를보고 적절한 지연 수를 선택하면 시계열 모델의 표준 오류에 어떤 영향을 미칩니 까?

AIC / BIC 점수를 기반으로 모델을 선택하면 횡단면 방법과 유사한 영향을 미칠 것이라고 생각합니다. 나는 실제로이 분야에 대해 많이 알지 못 하므로이 시점에서 의견을 주시면 감사하겠습니다.

마지막으로 각 단계에 사용 된 정확한 기준을 기록한 경우 전체 프로세스를 부트 스트랩하여 표준 오류를 추정하고 이러한 문제를 해결할 수 있습니까?


이론적 ARMA 모델에서 표준 오차의 편차 (매개 변수?)가 중요합니까? ARMA 모델 ASFAIK는 주로 단기 예측에 사용됩니다. 매개 변수 해석과 그 속성의 문제는 덜 중요합니다. 물론 혁신 프로세스 (오류 용어)의 특성을 의미하지 않는 경우 관련 예측 간격을 생성 할 계획입니다.
Dmitrij Celov

@Dmitrij, 계수의 표준 오차 편차에 대해 우려하는 두 가지 주요 이유가 있습니다. 첫 번째는 암시 한 바와 같이 예측 구간을 만드는 것입니다. 두 번째는 이코노미스트가 대답에 관심을 갖는 일반적인 질문 인 모델의 구조적 중단을 테스트하는 것입니다. 선택 절차를 사용하여 생성 된 표준 오류는 너무 작아서 예측 간격이 너무 좁고 테스트 통계가 너무 큽니다.
Charlie

그러나 이론이없는 모델에서 (이론이없고, 구조가 없음을 의미), 구조적 중단은 모델 잔차의 거동에 관한 일반적인 테스트가 될 매개 변수와 거의 관련이 없습니다. 이 경우 편견없는 모델 매개 변수 추정치가 덜 중요하며 ARMA에는 구조적 모델 해석이 없습니다. 따라서, parsimonious 모델은 작은 표본 추정기의 일반적으로 열악한 속성과 예측 정확도의 균형이 잘 맞기 때문에 실제로 더 나은 예측 변수입니다.
Dmitrij Celov

많은 매개 변수가있는 데이터 생성 프로세스를 알고 있더라도 작은 샘플에서는 더 간단한 모델이 더 나은 예측을 수행하지만 구조적 맥락에서 그러한 모델의 매개 변수는 매우 바이어스됩니다 (변수 바이어스 생략)!
Dmitrij Celov

답변:


5

모든 모델 선택 절차는 표준 오류에 영향을 미치며 이는 거의 설명되지 않습니다. 예를 들어, 예측 구간은 추정 된 모델에서 조건부로 계산되며 모수 추정 및 모델 선택은 일반적으로 무시됩니다.

모델 선택 프로세스의 효과를 추정하기 위해 전체 절차를 부트 스트랩 할 수 있어야합니다. 그러나 직렬 상관 관계를 유지해야하기 때문에 시계열 부트 스트랩은 일반 부트 스트랩보다 까다 롭습니다. 블록 부트 스트랩은 블록 구조로 인해 일부 직렬 상관이 없어지지 만 가능한 한 가지 방법입니다.


6

내 생각에 적절한 수의 지연을 선택하는 것은 단계적 순회 회귀 절차에서 입력 시리즈 수를 선택하는 것과 다르지 않습니다. 지연 또는 특정 입력 시리즈의 점진적 중요성은 임시 모델 사양의 기초입니다.

acf / pacf가 Box-Jenkins 모델 선택의 유일한 기초라고 주장 했으므로 어떤 경험이 저에게 가르쳐 준 내용을 알려 드리겠습니다. 시리즈가 붕괴되지 않는 acf를 나타내는 경우, 1965 년경 Box-Jenkins 접근법은 데이터 차이를 제안합니다. 그러나 시리즈가 나일 데이터 와 같은 수준 이동을 갖는 경우 , "시각적으로 명백한"정상 성이 아닌 것은 필요한 구조의 증상이지만 차이점은 해결 방법이 아닙니다. 이 Nile 데이터 세트는 먼저 레벨 시프트의 필요성을 식별함으로써 차이없이 모델링 할 수 있습니다. 비슷한 맥락에서 우리는 acf가 계절적 구조를 나타내는 경우 ( 즉,s, 2s, 3s, ...의 지연에 중요한 값이 있으면 계절 ARIMA 구성 요소를 통합해야합니다. 토론을 위해 평균 간격으로 고정 된 간격으로 6 월마다 "높은 가치"가 있다고 말하는 시리즈를 고려하십시오. 이 시리즈는 계절적 구조를 처리하기 위해 "구식"더미 시리즈 0과 1 (6 월)을 통합하여 올바르게 처리됩니다. 계절 ARIMA 모델은 지정되지 않았지만 찾을 수있는 X 변수 대신 메모리를 잘못 사용합니다. 불특정 결정 론적 구조를 식별 / 통합하는이 두 가지 개념은 중재 탐지의 일반적인 개념 하에서 I. Chang, William Bell, George Tiao, R.Tsay , Chen 의 작업을 직접 적용하는 것이다 .

오늘날에도 일부 분석가들은 "마인드리스 메모리 모델링"이 펄스, 레벨 시프트, 계절 펄스 및 로컬 타임 트렌드와 같은 결정 론적 구조가 존재하지 않거나 더 나쁘지만 아직 재생되지 않는다는 것을 인식하지 않고 메모리 최대화 전략을 마지 못해 메모리 최대화 전략을 수행하고 있습니다. 모델 식별에서 역할. 이것은 머리를 모래에 넣는 것과 유사합니다 (IMHO).


모델 선택에 대한 훌륭한 조언에 감사하지만이 프로세스가 추론에 미치는 영향에 관심이있었습니다.
Charlie

Charlie : 자기 상관 또는 상호 상관 검토 또는 그래픽 표현과 같은 다른 모델 식별 절차와 같은 선행 데이터 진단이 추정 된 매개 변수의 통계적 유의성에 영향을 미친다고 생각하지 않습니다. 그것은 나의 의견이며 "여기서 나는 다른 것을 할 수 없다"고 말했다. kudos에 감사하고 어떤 식 으로든 어린 Charlie를 도울 수 있다면 Phd 논문에서 지원하는 (무상!) 자원으로 등재되기를 바랍니다.
IrishStat
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.