복잡한 계절성에 대한 계절성 지수 계산


11

지수 평활을 사용하여 소매 항목 (주별)을 예측하고 싶습니다. 나는 sesonality 인덱스를 계산하고 저장하고 적용하는 방법에 지금 붙어 있습니다.

문제는 내가 찾은 모든 예제가 일종의 간단한 계절성을 다루는 것입니다. 제 경우에는 다음과 같은 문제가 있습니다. 1. 매년 같은 주에 계절이 발생하지 않습니다 : 움직일 수 있습니다. 마디-그라, 빌트, 부활절 및 기타 몇 가지. 2. 연도에 따라 계절이 달라집니다. 예를 들어, 국경일이 있습니다. 휴일이 주말에 가까운 지 여부에 따라 고객은 도시를 떠나거나 떠나지 않을 것입니다. 따라서 두 가지 계절이 있습니다. 하나는 고객이 도시를 떠나고 다른 하나는 도시를 떠나지 않습니다. 3. 때때로 2 시즌 (또는 3 시즌)이 동시에 발생합니다. 예를 들어, 발렌타인 시즌과 동시에 "Mardi-Gras"시즌이 발생했습니다.
4. 때때로 계절의 기간이 변경됩니다. 예를 들어, "할로윈 시즌"은 올해 초에 시작되었습니다. 크리스마스는 매년 우리가 제품을 운반하기 시작하는 것처럼 보이는 또 다른 예입니다.

어떤 종류의 "계절 프로필"을 설정하는 방법을 찾아야 할 것 같습니다. 그러면 특정 시나리오에 따라 올바른 계절 지수를 얻기 위해 어떻게 든 추가됩니다. 말이 돼?

아무도 내가 이것을하는 방법에 대한 실용적인 정보를 어디서 찾을 수 있는지 알고 있습니까?

고마워, Edgard

답변:


7

설명하는 계절의 종류에 대해 더미 변수 접근 방식이 가장 좋습니다. 그러나 이는 지수 평활 프레임 워크보다 ARIMA 프레임 워크에서 처리하기가 더 쉽습니다. 여기서 각 변수는 휴일 또는 축제 이벤트 중 하나에 해당합니다. 이것이 R 의 함수가 회귀 변수에 맞는 방법입니다 (ARIMAX 모델이 아닌 ARIMA 오류가있는 회귀).

yt=a+b1Dt,1++bmDt,m+NtNtARIMA
Dt,karima

지수 평활화 프레임 워크를 고수하고 싶다면 2008 년 지수 평활 법에 공변량을 포함시키는 방법에 대한 논의가 있습니다. 우리가 논의하는 계절적 합병증의 유형이 설명하는 움직이는 축제 종류보다 더 어렵지만 복잡한 계절성을 가진 지수 평활 에 관한 최근 논문을 볼 수도 있습니다 .


안녕 곽과 롭. 이것을 봐 주셔서 감사합니다. 이것이 내가 익숙한 지수 평활 법을 사용하고 싶었습니다. ARIMA 프레임 워크를 사용하는 방법을 배워야한다고 생각합니다. 그러한 더미 변수 접근법을 적용하기 위해 ARIMA 프레임 워크에 대해 충분히 배우는 데 도움이되는 좋은 책을 추천 해 주시겠습니까? Bowerman의 "예측, 시계열 및 회귀"및 Levenbach "예측 : 수요 관리를위한 실습 및 프로세스"를 사용하여 지수 평활에 대해 배웠습니다. 이것들이 내가 필요한 것에 충분히 상세하게 있는지 모르겠습니다. 감사!
elriba

Bowerman O'Connell과 Koehler는 ARIMA 모델을 소개하는 데는 좋지만 공변량을 가진 ARIMA가 포함되어 있지 않다고 생각합니다. 소개 수준에서 ARIMA 오류로 ARIMA 모델링 및 회귀를 다루는 1998 교과서를 시도해 볼 수 있습니다. 자세한 내용은 robjhyndman.com/forecasting 을 참조하십시오.
Rob Hyndman

1

간단한 수정 사항은 스펙에 이벤트 인형을 포함시키는 것입니다.

(1)yt^=λ1yt1+...+λkytk+ϕ1Dt,1+ϕmDt,m

여기서 지표 촬영 값 주 경우 이벤트가 모두, 그렇지 않으면 (마디가 그라 말)와 0 이벤트는 중요하다고 생각.Dt,m1tmm

사양 의 첫 번째 부분 은 본질적으로 기하 급수적으로 만 지연의 함수에 따라 가중치가 (OLS에 의해 추정 됨).λ1yt1+...+λkytk

이것은 각 사건에 대해 적어도 20 개의 관측치 (즉, 20 개의 '마디 그라')가 있다고 전제합니다. 그렇지 않은 경우 일부 이벤트 (예 : 마디 그라 및 노동절)를 함께 묶어보십시오.

dlsales가 정지적이고 D가 더미 변수의 행렬이라고 가정 할 때, R을 맞추기 위해서는 (1) 다소 단호합니다.

fit<-arima(dlsales,order=c(4,0,0),seasonal = list(order = c(1, 0, 0),period=52),xreg = D)

여기서부터는 익숙하지 않은 내 답변 부분에 대해 더 구체적인 질문을 할 수 있습니다 (통계 수준이 무엇인지 모르겠습니다).


2
실제로 R의 arima 함수는 모델에 맞지 않습니다 (1). arima ()는 ARIMA 오류와 함께 회귀를 수행하며 방정식 (1)은 ARMAX 모델입니다.
Rob Hyndman

Rob :> 방정식 1을 편집했습니다. arima 오류와 함께 armax와 회귀의 차이가 설명되는 소스를 가리킬 수 있습니다 (또는 직관적 인 설명 제공). 또한 ARMAX 모델을 구현하는 R 패키지에 대해 알고 있습니까? 미리 감사드립니다.
user603

공변량이 하나 인 1 차 ARMAX 모형은 y_t = a + bx_t + cy_ {t-1} + e_t입니다. 여기서 e_t는 iid 0 평균입니다. ARIMA 오류가있는 해당 회귀는 y_t = a + bx_t + n_t입니다. 여기서 n_t = phi * n_ {t-1} + z_t이고 z_t는 iid 0 평균입니다.
Rob Hyndman

1
@kwak. 먼저, n_t = phi n_ {t-1} + z_t는 AR (1)입니다. 차수 1의 이동 평균 프로세스는 n_t = theta z_ {t-1} + z_t입니다. 둘째, MA 오류에 대한 회귀는 MAX 모델과 같습니다. 그러나 오류 프로세스에서 AR 용어를 추가하면 두 클래스 사이에 동등성이 없습니다. 셋째, TSA의 arimax () 함수는 전달 함수 모델에 적합하며 특별한 경우 ARIMA 오류가있는 회귀입니다. ARIMAX 모델에 맞지 않습니다. 다양한 모델 클래스를 찾기가 어려우므로 어디에서나 논의하기 때문에 이에 대한 블로그 게시물을 작성할 수 있습니다.
Rob Hyndman

2
나는에서 다양한 모델을 요약하기 위해 노력했습니다 robjhyndman.com/researchtips/arimax
롭 Hyndman에게
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.