시계열 예측시 모범 사례


10

정확도를 높이기 위해 단기 부하 예측 및 기후 / 날씨 데이터 사용에 대해 몇 달 동안 노력해 왔습니다. 나는 컴퓨터 과학 배경을 가지고 있으며 ARIMA 모델과 같은 통계 도구를 사용하여 큰 실수와 불공평 한 비교를하려고하지 않습니다. 몇 가지 사항에 대한 귀하의 의견을 알고 싶습니다.

  1. 날씨 데이터가 예측에 미치는 영향을 조사하기 위해 (S) ARIMA 및 (S) ARIMAX 모델을 모두 사용하고 있습니다. 지수 평활 법도 사용해야한다고 생각하십니까?

  2. 300 개의 일일 샘플 시계열을 가지고 처음 2 주부터 시작하여 auto.arima R 함수 (예측 패키지)로 구축 된 모델을 사용하여 5 일 전에 예측을 수행합니다. 그런 다음 데이터 세트에 다른 샘플을 추가하고 모델을 다시 보정하고 사용 가능한 데이터가 끝날 때까지 5 일 동안 예측을 수행합니다. 이 작동 방식이 맞다고 생각하십니까?

우리 작품의 목표는 공학 저널 기사이지만 통계적인 관점에서 가능한 한 엄격한 작업을하고 싶습니다.


1
이 질문은 밀접한 관련이있는 것으로 보입니다 : stats.stackexchange.com/questions/16915/…
whuber

답변:


9
  1. 지수 평활 모델도 살펴볼 가치가 있다고 생각합니다. 지수 평활 모델은 ARIMA 모델과 근본적으로 다른 클래스의 모델이며 데이터에 대해 다른 결과를 산출 할 수 있습니다.

  2. 이것은 유효한 접근법처럼 들리며 Rob Hyndman이 제안한 시계열 교차 유효성 검사 방법과 매우 유사합니다 .

각 예측 (지수 평활, ARIMA, ARMAX)에서 교차 유효성 검사 오류를 집계 한 다음 전체 오류를 사용하여 세 가지 방법을 비교합니다.

auto.arima를 사용하는 대신 ARIMA 매개 변수에 대한 "그리드 검색"을 고려할 수도 있습니다. 그리드 검색에서는 arima 모델에 대해 가능한 각 매개 변수를 탐색 한 다음 예측 정확도를 사용하여 "최상의"매개 변수를 선택합니다.


답장을 보내 주셔서 감사합니다. STEPWISE 검색이 비활성화 된 상태에서 auto.arima를 사용하고 있으며 이러한 방식으로 최소-최대 범위 사이의 모든 매개 변수를 탐색 할 것이라고 생각합니다 (Hyndman & Kandahar 2008 논문은 아직 읽지 않았습니다)
Matteo De Felice

@ Matteo De Felice : 문제는 AIC를 기반으로 매개 변수를 최적화하는 것입니다. 교차 검증으로 평가할 수있는 샘플 외부 성능으로 이러한 매개 변수를 최적화 할 가치가 있다고 제안했습니다. 또한 다른 모델 (예 : ETS)을 비교하려면 다른 유형의 모델 (예 : auto.arima 및 ets)간에 AIC를 비교할 수 없으므로 샘플 외부 성능 메트릭이 필요합니다.
Zach

이 시점에서 그리드 검색 (stepwise = FALSE와 함께 auto.arima 사용)을 수행 한 다음 성능을 평가하기 위해 가장 빈번한 모델을 시도했습니다.
Matteo De Felice

@Matteo De Felice : 시계열 교차 검증을 구현하는 데 문제가있는 경우이 블로그 게시물이 도움이 될 수 있습니다. robjhyndman.com/researchtips/tscvexample
Zach

ARIMA와 ETS 모델은 근본적으로 다르지 않습니다. 실제로 선형 지수 평활 모델은 ARIMA 모델의 특별한 경우입니다. otexts.org/fpp/8/10을 참조하십시오 .
사마귀
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.