불규칙한 간격으로 1 년 동안 샘플링 된 연속 변수가 있습니다. 어떤 날에는 시간당 하나 이상의 관측치가 있지만 다른 기간에는 며칠 동안 아무것도 없습니다. 따라서 몇 달 (예 : 10 월)은 샘플링이 많고 다른 달은 샘플링되지 않기 때문에 시계열에서 패턴을 감지하기가 특히 어렵습니다.
내 질문은이 시계열을 모델링하는 가장 좋은 방법은 무엇입니까?
- ARMA와 같은 대부분의 시계열 분석 기술에는 고정 주파수가 필요하다고 생각합니다. 일정한 샘플을 얻거나 매우 상세한 데이터의 하위 집합을 선택하기 위해 데이터를 집계 할 수 있습니다. 두 옵션 모두 원래 데이터 세트에서 일부 패턴이 누락되어 고유 한 패턴이 드러날 수 있습니다.
- 시리즈를 사이클로 분해하는 대신 모델에 전체 데이터 세트를 공급하고 패턴을 선택할 것으로 기대할 수 있습니다. 예를 들어, 시간, 요일 및 월을 범주 형 변수로 변환하고 좋은 결과로 다중 회귀 분석을 시도했습니다 (R2 = 0.71).
ANN과 같은 기계 학습 기술이 고르지 않은 시계열에서 이러한 패턴을 선택할 수 있다는 아이디어가 있지만 누군가 시도해 보았는지 궁금해하고 신경망에서 시간 패턴을 표현하는 가장 좋은 방법에 대한 조언을 제공 할 수 있습니다.