ARIMA 모델 해석


19

ARIMA 모델에 대한 질문이 있습니다. 예측하고 싶은 시계열 Yt 가 있고 ARIMA(2,2) 모델이 예측 운동을 수행하는 좋은 방법 인 것 같습니다.

ΔYt=α1ΔYt1+α2ΔYt2+νt+θ1νt1+θ2νt2
이제 지연된 는 오늘날 내 시리즈가 이전 이벤트의 영향을 받는다는 것을 의미합니다. 이것은 말이됩니다. 그러나 오류의 해석은 무엇입니까? 나의 이전 잔여 물 (내 계산에서 얼마나 벗어 났는지)이 오늘 내 시리즈의 가치에 영향을 미치고 있습니까? 이 회귀에서 지연된 잔차는 회귀의 곱 / 나머지이므로 어떻게 계산됩니까?Y

4
ARIMA 모형이 이론적 모형 이라는 점을 기억해야 하므로 추정 회귀 계수 해석의 일반적인 규칙 이 동일한 방식으로 엄격하게 적용 되지는 않습니다 . ARIMA 모델에는 알아야 할 특정 기능이 있습니다. 예를 들어 AR (1)에서 값이 낮을수록 수렴 속도가 빠릅니다. 그러나 AR (2) 모델을 예로 들어 보겠습니다. 모든 AR (2) 모델이 같은 것은 아닙니다! 예를 들어, 조건 ( α 2 1 + 4 α 2 < 0 ) 이 충족되면 AR (2)는 의사주기적인 동작을 표시 하고 결과적으로 예측주기는 확률 적 사이클입니다.α1(α12+4α2<0)
Graeme Walsh

3
다소 유사한 방식으로, 벡터 자기 회귀를 다룰 때, 추정 된 계수가 아닌 임펄스 응답 함수 (IRF)를 해석하는 경향이있다. 계수는 종종 해석하기가 어렵지만 일반적으로 IRF로 이해 될 수 있습니다. 호기심으로 저자가 ARIMA 모델의 계수 해석에 많은 관심을 기울인 논문이 많이 있습니까?
Graeme Walsh

2
표기법 문제가있는 것 같습니다. ARIMA 모델에는 각 AR / I / MA 구성 요소에 대해 각각 3 개의 항 ( p , d , q ) 이 있고 ARMA 모델에는 2 개 (예 : ARMA ( 2 ) 가 있으므로 " "는 맞지 않습니다 . 2 ) )-그러나 첫 번째 차이점이있는 것처럼 보이므로 ARIMA ( 2 , 1 , 2 )를 의미 합니다. 의도를 반영하도록 수정하십시오. 아리마(2,2)(,,)ARMA(2,2)ARIMA(2,1,2)
Glen_b-복지국 모니카

2
@Glen_b 나는 다른 질문 에 대해 똑같은 것을 요구하는 것을 기억합니다 . 우리는 일종의 중복이 있음이 밝혀졌습니다. 현재의 질문과 관련된 질문은 매우 유사합니다.
Graeme Walsh

답변:


36

ARIMA 모형이 이론적 모형 이라는 점을 기억해야 하므로 추정 회귀 계수 해석에 대한 일반적인 접근 방식이 실제로 ARIMA 모델링에 적용되지는 않습니다.

추정 된 ARIMA 모델을 해석 (또는 이해)하기 위해, 다수의 공통 ARIMA 모델에 의해 표시되는 다양한 특징을 인식하는 것이 좋습니다.

다양한 ARIMA 모델에서 생성 된 예측 유형을 조사하여 이러한 기능 중 일부를 탐색 할 수 있습니다. 이것이 내가 취한 주요 접근법이지만, 다른 대안은 다른 ARIMA 모델 (또는 확률 적 차이 방정식)과 관련된 임펄스 응답 함수 또는 동적 시간 경로 를 보는 것 입니다. 마지막에 이것에 대해 이야기하겠습니다.

AR (1) 모델

AR (1) 모델을 잠깐 살펴 보자. 이 모델에서 의 값이 낮을수록 수렴 속도 (평균)가 빠를 수 있습니다. α 1에 대해 서로 다른 값을 가진 작은 모의 AR (1) 모델에 대한 예측의 특성을 조사하여 AR (1) 모델의 이러한 측면을 이해하려고 시도 할 수 있습니다 .α1α1

우리가 논의 할 4 가지 AR (1) 모델 세트는 다음과 같이 대수 표기법으로 작성 될 수 있습니다 : 여기서 C 는 상수이고 나머지 표기법은 OP에서 따릅니다. 알 수있는 바와 같이, 각 모델은 α 1 값에 대해서만 상이하다.

와이=+0.95와이1+ν                               (1)와이=+0.8와이1+ν                                (2)와이=+0.5와이1+ν                                ()와이=+0.4와이1+ν                                (4)
α1

아래 그래프에서이 네 가지 AR (1) 모델에 대한 표본 외부 예측을 표시했습니다. AR (1) 모델에 대한 예측 은 다른 모델에 비해 느린 속도로 수렴 됨을 알 수 있습니다 . α 1 = 0.4 인 AR (1) 모형에 대한 예측 은 다른 것보다 빠른 속도로 수렴됩니다.α1=0.95α1=0.4

여기에 이미지 설명을 입력하십시오

참고 : 빨간색 선이 수평이면 시뮬레이션 된 계열의 평균에 도달 한 것입니다.

MA (1) 모델

이제 대해 서로 다른 값을 가진 4 개의 MA (1) 모델을 고려해 봅시다 . 우리가 논의 할 네 가지 모델은 다음과 같이 쓸 수 있습니다 : Y t = C + 0.95 ν t - 1 + ν t ( 5 )θ1

와이=+0.95ν1+ν                               (5)와이=+0.8ν1+ν                                (6)와이=+0.5ν1+ν                                (7)와이=+0.4ν1+ν                                (8)

아래 그래프에서 나는이 네 가지 MA (1) 모델에 대한 표본 외 예측을 도표화했습니다. 그래프에서 알 수 있듯이 네 가지 경우 모두 예측의 동작은 매우 유사합니다. 평균에 대한 빠른 (선형) 수렴. AR (1) 모델과 비교할 때 이러한 예측의 역학에는 다양성이 적습니다.

여기에 이미지 설명을 입력하십시오

참고 : 빨간색 선이 수평이면 시뮬레이션 된 계열의 평균에 도달 한 것입니다.

AR (2) 모델

더 복잡한 ARIMA 모델을 고려하기 시작하면 상황이 훨씬 더 흥미로워집니다. AR (2) 모델을 예로 들어 보겠습니다. 이것들은 AR (1) 모델에서 조금만 올라갔습니다. 글쎄, 우리는 그것을 생각하고 싶을 수도 있지만, AR (2) 모델의 역학은 우리가 곧 보게 될 것처럼 매우 다양합니다.

네 가지 AR (2) 모델을 살펴 보겠습니다.

와이=+1.7와이10.8와이2+ν                               (9)와이=+0.9와이10.2와이2+ν                                (10)와이=+0.5와이10.2와이2+ν                                (11)와이=+0.1와이10.7와이2+ν                                (12)

이러한 각 모델과 관련된 표본 외부 예측이 아래 그래프에 표시됩니다. AR (1)과 유사하게 동작하는 모형 2의 예측 (오른쪽 그림)을 제외하고는 각각 서로 크게 다르며 위에서 본 예측과 비교할 때 상당히 다양합니다. 모델.

여기에 이미지 설명을 입력하십시오

참고 : 빨간색 선이 수평이면 시뮬레이션 된 계열의 평균에 도달 한 것입니다.

여기서 중요한 점은 모든 AR (2) 모델이 동일한 다이나믹을 갖는 것은 아닙니다! 예를 들어 조건이

α12+4α2<0,
AR (2) 모델은 의사 주기적 동작을 표시하므로 예측 결과가 확률 론적 사이클로 나타납니다. 반면에이 조건이 충족되지 않으면 확률 적주기가 예측에 나타나지 않습니다. 대신, 예측은 AR (1) 모델에 대한 예측과 더 유사합니다.

위의 조건은 일반 솔루션에서 선형, 자율, 2 차 차이 방정식의 균질 형태 (복소수 근 포함)에 이르기까지 다양합니다. 만약 이것이 당신에게 이질적인 경우, 나는 Hamilton (1994) 1 장과 Hoy et al. (2001).

4 개의 AR (2) 모델에 대해 위 조건을 테스트하면 다음과 같은 결과가 발생합니다.

(1.7)2+4(0.8)=0.31<0                               (13)(0.9)2+4(0.2)=0.01>0                                 (14)(0.5)2+4(0.2)=0.55<0                               (15)(0.1)2+4(0.7)=2.54<0                               (16)

플로팅 된 예측의 출현으로 예상되는 바와 같이, 조건은 모델 2를 제외한 4 가지 모델 각각에 대해 충족됩니다. 그래프에서 살펴보면 모델 2의 예측은 AR (1) 모델의 예측과 유사하게 동작합니다 ( "일반적으로"). 다른 모형과 관련된 예측에는주기가 포함됩니다.

응용-모델링 인플레이션

발 아래에 배경이 있으므로 응용 프로그램에서 AR (2) 모델을 해석해 봅시다. 인플레이션 율에 대해 다음 모델을 고려하십시오 (π) :

π=+α1π1+α2π2+ν.
이러한 모형과 관련이있는 자연스러운 표현은 "오늘 인플레이션은 어제 인플레이션 수준과 어제 전날 인플레이션 수준에 달려 있습니다" 와 같습니다 . 이제, 나는 그런 해석에 반대하지는 않겠지 만, 약간의주의가 필요하고 우리는 적절한 해석을 고안하기 위해 좀 더 깊이 파고들 것을 제안합니다. 이 경우 인플레이션이 이전의 인플레이션 수준과 어떤 관련이 있는가? 사이클이 있습니까? 그렇다면 몇 사이클이 있습니까? 우리는 최고점과 최저점에 대해 말할 수 있습니까? 예측이 평균에 얼마나 빨리 수렴됩니까? 등등.

다음은 AR (2) 모델을 해석하려고 할 때 물어볼 수있는 질문입니다. 보시다시피 추정 된 계수를 취하고 "이 변수의 1 단위 증가는 물론 종속 변수의 많은 단위 증가 " - 물론 ceteris paribus 조건을 해당 명령문 에 첨부하십시오 .

지금까지의 논의에서 우리는 AR (1), MA (1) 및 AR (2) 모델의 선택 만 탐색했음을 명심하십시오. 우리는 더 높은 지연을 포함하는 혼합 ARMA 모델과 ARIMA 모델의 역학을 보지 못했습니다.

해당 범주에 속하는 모델을 해석하는 것이 얼마나 어려운지를 보여주기 위해 또 다른 인플레이션 모델 인 ARMA (3,1) α2 0으로 제한 :

π=+α1π1+απ+θ1ν1+ν.

원하는 것을 말하지만 여기에서 시스템 자체의 역학을 이해하는 것이 좋습니다. 이전과 마찬가지로 모델에서 어떤 종류의 예측이 생성되는지 확인할 수 있지만이 답변의 시작 부분에서 언급 한 대안 은 시스템과 관련된 임펄스 응답 함수 또는 시간 경로 를 확인하는 것입니다.

이를 통해 임펄스 응답 기능에 대해 논의 할 답변의 다음 부분으로 이동합니다.

임펄스 응답 기능

벡터 자기 회귀 (VAR)에 익숙한 사람들은 일반적으로 임펄스 응답 함수를 해석하여 추정 된 VAR 모델을 이해하려고 시도한다는 것을 알고있을 것입니다. 어쨌든 해석하기 어려운 계산 된 계수를 해석하려고하기보다는.

ARIMA 모델을 이해하려고 할 때도 동일한 방법을 사용할 수 있습니다. 즉, "오늘의 인플레이션은 어제 인플레이션과 2 개월 전의 인플레이션에 달려 있지만 지난 주 인플레이션에는 달려 있지 않습니다." 대신 임펄스 응답 함수를 플로팅하고이를 이해하려고합니다.

응용-4 가지 매크로 변수

이 예 (Leamer (2010)에 기초)에서, 4 개의 거시 경제 변수에 기초한 4 개의 ARIMA 모델을 고려해 보자. GDP 성장, 인플레이션, 실업률 및 단기 금리. 네 가지 모델이 추정되었으며 다음과 같이 쓸 수 있습니다.

와이=3.20+0.22와이1+0.15와이2+νπ=4.10+0.46π1+0.31π2+0.16π+0.01π4+ν=6.2+1.5810.642+ν아르 자형=6.0+1.18아르 자형10.23아르 자형2+ν
어디 와이 시간에 GDP 성장을 나타냅니다 , π 인플레이션, 실업률을 나타내고 아르 자형 단기 이자율 (3 개월 재무부)을 나타냅니다.

방정식은 GDP 성장률, 실업률 및 단기 금리가 AR (2) 프로세스로 모델링되고 인플레이션이 AR (4) 프로세스로 모델링됨을 보여줍니다.

각 방정식의 계수를 해석하는 대신 임펄스 응답 함수 (IRF)를 플로팅하고 대신 해석해 봅시다. 아래 그래프는 이러한 각 모델과 관련된 임펄스 응답 기능을 보여줍니다.

여기에 이미지 설명을 입력하십시오

이것을 IRF 해석의 마스터 클래스로 삼지 마십시오. 기본 소개처럼 생각하십시오. 그러나 어쨌든 우리가 두 가지 개념에 익숙해 져야하는 IRF를 해석하는 데 도움이됩니다. 운동량끈기 .

이 두 개념은 Leamer (2010)에서 다음과 같이 정의됩니다.

모멘텀 : 모멘텀은 같은 방향으로 계속 움직이는 경향입니다. 운동량 효과는 평균을 향한 회귀 (수렴)의 힘을 상쇄시킬 수 있으며 변수가 역사적 평균에서 일정 시간 동안 멀어 지지만 무한정 이동할 수는 없습니다.

지속성 : 지속성 변수는 현재 위치에 매달리고 역사적 평균에 대해서만 천천히 수렴합니다.

이 지식을 갖추고, 이제 우리는 질문을합니다 : 변수가 역사적 의미에 있고 단일 기간에 일시적으로 1 단위의 충격을받는다고 가정하면, 변수는 미래에 어떻게 반응할까요? 이것은 예측에주기가 포함되어 있는지와 같이 이전에 요청한 질문을하는 것과 유사합니다 . , 얼마나 빨리 예측은 평균에 수렴 하는가?

마침내 우리는 이제 IRF 해석을 시도 할 수 있습니다.

1 회 충격 후 실업률과 단기 이자율 (3 개월 재무부)은 과거 평균에서 더 나아갑니다. 이것이 운동량 효과입니다. IRF는 또한 실업률이 단기 금리보다 훨씬 큰 폭으로 초과하는 것을 보여줍니다.

우리는 또한 모든 변수가 각각 다른 비율로이 작업을 수행하지만 모든 변수가 이전의 평균으로 돌아가는 것을 볼 수 있습니다. 예를 들어, GDP 성장률은 충격 후 약 6 기간 후에 역사적 평균으로 돌아오고, 실업률은 약 18 기간 후에 역사적 평균으로 돌아 오지만 인플레이션 및 단기이자는 역사적 수단으로 돌아 가기 위해 20 기간보다 오래 걸립니다. 이런 의미에서 GDP 성장은 4 가지 변수 중에서 가장 덜 지속되는 반면 인플레이션은 매우 지속적이라고 할 수 있습니다.

4 개의 ARIMA 모델이 4 개의 매크로 변수 각각에 대해 알려주는 것을 이해하기 위해 (적어도 부분적으로) 관리했다고 말하는 것이 공정한 결론이라고 생각합니다.

결론

ARIMA 모델의 추정 계수 (많은 모델에서는 어려움)를 해석하지 말고 시스템의 역학을 이해하십시오. 모델에서 생성 된 예측을 탐색하고 임펄스 응답 함수를 플롯하여이를 시도 할 수 있습니다.

[누군가 원하는 경우 내 R 코드를 공유 할 수있어 행복합니다.]

참고 문헌

  • JD 해밀턴 (1994). 시계열 분석 (Vol. 2). 프린스턴 : 프린스턴 대학 출판부.
  • Leamer, E. (2010). 거시 경제 패턴 및 사례-MBA를위한 안내서, Springer.
  • Stengos, T., M. Hoy, J. Livernois, C. McKenna and R. Rees (2001). 경제학 수학, 2 판, MIT Press : 케임브리지, MA.

3
비 VAR에 IRF를 적용하는 것을 좋아합니다. 그들은 항상 관련이있는 것 같고 나는 단지 ARIMA에 IRF를 사용하는 것을 생각하지 않았습니다. (그러면 누가 MA 용어가 무엇인지 실제로 이해할 수 있습니까?)
Wayne

2
정말 좋은 답변입니다!
Richard Hardy

9

Note that due to Wold's decomposition theorem you can rewrite any stationary ARMA model as a MA() model, i.e. :

ΔYt=j=0ψjνtj

In this form there are no lagged variables, so any interpretation involving notion of a lagged variable is not very convincing. However looking at the MA(1) and the AR(1) models separately:

Yt=νt+θ1νt1

Yt=ρYt1+νt=νt+ρνt1+ρ2νt1+...

you can say that error terms in ARMA models explain "short-term" influence of the past, and lagged terms explain "long-term" influence. Having said that I do not think that this helps a lot and usually nobody bothers with the precise interpretation of ARMA coefficients. The goal usually is to get an adequate model and use it for forecasting.


+1 This is more or less what I was trying to get at in my comments above.
Graeme Walsh

하, 나는 대답을 쓸 때 당신의 의견을 보지 못했습니다. 나는 그것들을 대답으로 바꾸는 것이 좋습니다.
mpiktas

8

I totally agree with the sentiment of the previous commentators. I would like to add that all ARIMA model can also be represented as a pure AR model. These weights are referred to as the Pi weights as compared to the pure MA form (Psi weights) . In this way you can view (interpret) an ARIMA model as an optimized weighted average of the past values. In other words rather than assume a pre-specified length and values for a weighted average , an ARIMA model delivers both the length (n) of the weights and the actual weights (c1,c2,...,cn).

Y(t)=c1Y(t1)+c2Y(t2)+c3Y(t3)+...+cnY(tn)+a(t)

In this way an ARIMA model can be explained as the answer to the question

  1. How many historical values should I use to compute a weighted sum of the past?
  2. Precisely what are those values?
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.