ARIMA 프로세스에 대한 Box-Jenkins 방법은 정확히 무엇입니까?


10

위키 백과 페이지는 박스 - 젠킨스는 시계열에 ARIMA 모델을 피팅하는 방법이라고 말한다. 이제 ARIMA 모델을 시계열에 맞추려면 SAS를 열고 호출 proc ARIMA하고 매개 변수 를 제공하면 SAS에서 AR 및 MA 계수를 제공합니다. 이제 의 다른 조합을 시도 할 수 있으며 SAS는 각 경우마다 계수 세트를 제공합니다. Akaike 정보 기준이 가장 낮은 세트를 선택합니다.,,,,

내 질문은 : 위의 절차에서 Box-Jenkins를 어디에 사용 했습니까? Box-Jenkins를 사용하여 의 초기 추정치를 제시해야 합니까? 아니면 SAS가 어떻게 든 내부적으로 사용 했습니까?,,

답변:


10

Box와 Jenkins 자체는 AIC를 사용하지 않았습니다. 그들의 책은 1970 년에 이전에 개발 된 방법론을 바탕으로 나 왔으며, AIC에 관한 Akaike의 논문은 그 책이 출판 된 후 얼마되지 않았다.

그들의 방법론은 그들의 책 [1]에 요약되어 있지만, 오늘날 "Box-Jenkins"맨틀 아래에 포함 된 것은 조금 더 넓고 사람마다 다릅니다.

Box와 Jenkins 자체는 모델을 식별하는 데 사용 된 프로세스의 유용한 요약으로 간주 될 수있는 모델 식별에 대한 간단한 순서도를 제공합니다. (가능하다면이 책을 보시길 권합니다. 가장 괜찮은 대학교 도서관에는 사본이 있어야합니다.)

모델 식별, 추정 및 진단 검사 / 검증 단계 (모델이 부적절하면 첫 번째 단계로의 복귀 포함)를 통합 한 다음 적절한 모델이 식별되면 모델을 예측할 수 있습니다.

여기 의 wikipedia 페이지 는 관련된 종류의 개요를 제공하지만, 책이 나온 이후 사람들이 좋아하는 것에 추가 된 많은 것들이 포함되어 있습니다. 실제로 요즘 Box-Jenkins 방법론을 설명하는 수많은 문서에는 AIC 또는 유사한 수량의 사용이 포함됩니다.

여기에 대한 토론도 참조 하십시오 .

최신 책 (예 : 위 위키 백과 페이지 참조)은 더 일반적인 '근대적 인'버전의 접근 방식을 제공합니다.

결국 Box-Jenkins 방법론이 실제로 "무엇"인지 알아 보려면 "책에서 시작"이라고 말합니다. ARIMA 모델에 대한 최근의 여러 가지 처리 방법은 대체로 유사한 방법론을 다루지 않습니다. ARIMA 모델을 다루는 합리적으로 적절한 시계열 책을 사용해보십시오.

[1] : 박스, 조지; Jenkins, Gwilym (1970),
시계열 분석 : 예측 및 제어
샌프란시스코 : 홀든 데이


10

Box-Jenkins 방법론은 ARIMA 모델을 작성하는 데 사용할 수있는 전략 또는 절차입니다. 이 방법론은 1970 년에 처음 출판 된 George EP Box 및 Gwilym M. Jenkins의 시계열 분석 : 예측 및 제어 책에 요약되어 있습니다. 더 최신판이 있습니다.

SAS를 열고 proc ARIMA를 호출하고 p, d 및 q의 공급 번호를 입력하면 ARIMA 모델 만 추정 한 것입니다. 맹목적으로, 즉 ARIMA 모델 자체를 식별하기 위해 인식 된 특정 방법론을 사용하지 않는 것은 소프트웨어의 위험과 일치하는 것과 조금 비슷합니다!

이 과정을 계속 반복하면 (많은 ARIMA 모델 추정) 결국 Akaike Information 기준이 가장 낮은 모델 (추정 한 모델 집합에서)을 선택할 수 있습니다. 이와 관련하여보다 체계적인 접근 방식은 다양한 모델에 대한 AIC 값을 비교하여 알고리즘을 사용하여 자동으로 ARIMA 모델을 선택하는 것입니다 (예 : R의 예측 패키지가 제공하는 모델)-관련 함수 이름 입니다 auto.arima().

어쨌든, 요약 한 절차는 일부 정보 기준 (이 경우 AIC이지만 다른 조치가 있음)을 최소화하여 ARIMA 모델을 선택하는 것과 관련이 있습니다. 이것은 하나의 특정 방법론이지만 Box-Jenkins 방법은 아닙니다. 대안.

Box-Jenkins 방법론은 5 단계 (때로는 3 단계 만 포함됨)로 구성됩니다.

  1. 정상 성 또는 정상 성이 아닌지 확인하고 필요한 경우 데이터를 변환합니다.
  2. 적합한 ARMA 모델의 식별;
  3. 선택한 모델의 매개 변수 추정;
  4. 모델 적합성 진단 점검; 과
  5. 2-5 단계의 예측 또는 반복.

특히 모델 빌더가 판단을 내리는 과정은 반복적 인 프로세스이며, 이는 단점으로 간주되는 방법론의 한 측면입니다. 판단 부분은 특히 두 가지 도구를 해석 할 때 작동합니다. 즉, (추정) 자기 상관 함수 (ACF) 및 부분 자기 상관 함수 (PACF).

Box-Jenkins 방법론의 실무자가 되려면 현대의 변형과 함께 원본 텍스트 (현대 교과서에서 누락 된 것을 놀라게 할 것입니다)를 참조하는 것이 좋습니다. Alan Pankratz에는 몇 가지 훌륭한 교과서가 있습니다. 예를 들어, 일 변량 상자-젠킨스 모형을 사용한 예측 : 개념 및 사례 .

경험에 따르면 "Box-Jenkins 방법론"이라는 용어는 느슨하게 사용 된 것으로 나타났습니다. 일부 사람들은 ARIMA 모델 작성과 관련된 실제 프로세스가 아니라 일반적으로 ARIMA 모델 작성을 언급하는 데 사용한다고 들었 기 때문입니다. @Glen_b가 지적했듯이 "요즘에는 AIC 또는 유사한 수량의 사용을 포함하는 Box-Jenkins 방법론을 설명하는 수많은 문서가 있습니다" .

Q : Box-Jenkins 방법론을 사용하여 p, d, q의 초기 추정치를 구해야합니까?

이미 언급했듯이 다양한 모델 선택 전략이 있기 때문에 Box-Jenkins 방법론을 사용해야 할 필요는 없지만 원하는 경우 가능합니다.

Q : SAS는 어떻게 든 내부적으로 사용 했습니까?

해당 소프트웨어가 매우 정교한 기능을 제공하지 않는 한 거의 없습니다! 소프트웨어가 수행하거나 수행 할 수있는 작업에 대한 자세한 내용은 공식 SAS 설명서를 참조하십시오. 그것이 R이라면 소스 코드를 볼 수는 있지만 이것이 SAS의 옵션인지 의심합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.