ARIMA 모델을 사용하여 예측을 진행하면서 계절 성과 드리프트에 맞는 ARIMA를 기반으로 예측을 개선 할 수있는 방법을 이해하려고합니다.
내 데이터는 다음과 같은 시계열입니다 (3 년 동안 명확한 추세와 눈에 띄는 계절성이 있으며 지연 12, 24, 36에서 자기 상관으로 지원되지 않는 것 같습니다 ??).
> bal2sum3years.ts
Jan Feb Mar Apr May Jun Jul Aug
2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729
2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888
2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416
Sep Oct Nov Dec
2010 2232261 2394644 2468479 2816287
2011 2480940 2699780 2760268 3206372
2012 2951516 3119176 3032960 3738256
제안 된 auto.arima(bal2sum3years.ts)
모델은 다음 모델을 제공했습니다.
Series: bal2sum3years.ts
ARIMA(0,0,0)(0,1,0)[12] with drift
Coefficients:
drift
31725.567
s.e. 2651.693
sigma^2 estimated as 2.43e+10: log likelihood=-321.02
AIC=646.04 AICc=646.61 BIC=648.39
그러나 acf(bal2sum3years.ts,max.lag=35)
0.3보다 높은 acf 계수는 표시하지 않습니다. 그러나 데이터의 계절성은 매년 초에 급증합니다. 그래프에서 계열이 다음과 같이 나타납니다.
fit=Arima(bal2sum3years.ts,seasonal=list(order=c(0,1,0),period=12),include.drift=TRUE)
function forecast(fit)
에 의해 호출 된 예측 은 다음 12 개월의 평균이 지난 12 개월의 데이터에 상수를 더한 것과 같습니다. 이것은을 호출하여 볼 수 있습니다 plot(forecast(fit))
.
또한 자기 상관 관계는 아니지만 양의 평균 (0이 아님)을 갖는 잔차를 확인했습니다.
내 생각에 맞는 것은 원래 시계열을 정확하게 모델링하지 않습니다 (파란색 원래 시계열, 빨간색은 fitted(fit)
:
손님은, 모델이 맞지 않습니까? 뭔가 빠졌습니까? 모델을 개선하려면 어떻게해야합니까? 이 모델은 문자 그대로 지난 12 개월이 걸리고 다음 12 개월을 달성하기 위해 상수를 추가하는 것으로 보입니다.
나는 시계열 예측 모델 및 통계의 상대적 초보자입니다.