일별 시계열 데이터에서 월별 효과를 모델링하는 방법은 무엇입니까?


11

매일 두 개의 시계열 데이터가 있습니다. 하나는 구독 sign-ups이고 다른 하나는 terminations구독입니다. 두 변수에 포함 된 정보를 사용하여 후자를 예측하고 싶습니다.

이 시리즈의 그래프를 보면 해지가 몇 달 전에 여러 번 가입 한 것과 관련이 있음이 분명합니다. 즉, 5 월 10 일에 가입이 급증하면 6 월 10 일, 7 월 10 일 및 8 월 10 일에 해지가 증가하지만 효과는 떨어지게됩니다.

이 특정 문제를 모델링하기 위해 어떤 모델을 사용할 수 있는지에 대한 힌트를 얻고 싶습니다. 모든 조언을 부탁드립니다 ..

지금까지 VAR 모델을 생각했지만 월간 효과를 포함하는 방법을 잘 모르겠습니다. 실제로 높은 지연을 사용하거나 계절에 따라 구성 요소를 추가합니까?

답변:


1

지연 29-31의 CCF 플롯은 어떤 모양입니까? 스파이크가 나타날 정도로 자주 발생합니까? Granger 테스트를 사용하여 어떤 지연 값이 통계적으로 유의한지 확인할 수 있습니다.


그렇습니다. 28-31 시차, 특히 30 시차에서 CCF 플롯에 분명한 급상승이 있습니다.
wije

1

월 레벨 모델

월 성향의 월 수준 변동을 파악하여 종료해야합니다 (예 : 크리스마스 휴가 기간 동안 가입이 4 월 동안 가입하는 것보다 종료 될 가능성이 더 높습니다). 일반적인 시계열 모델은 다음과 같습니다.

terminationst=β1signupst1+β2signupst2+..
. 이제 매개 변수가β1 등은 월별로 다르며 월 표시기 플래그를 나머지 예측 변수와 상호 작용할 수 있습니다.

따라서 새로운 기능 형태는

terminationst=β1signupst1MonthFlagt1+β2signupst2MonthFlagt1+..
이는 월별 모델을 구축하는 것과 유사하여 월별 변화를 종료하는 경향을보다 유연하게 캡처 할 수 있습니다.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.