사이드 취미 인 저는 예측 시계열 (특히 R 사용)을 탐색했습니다.
내 데이터의 경우 매일 거의 4 년 동안 매일 방문 횟수가 발생합니다. 이 데이터에는 몇 가지 뚜렷한 패턴이 있습니다.
- 월요일-금요일에는 많은 방문 (월 / 화에 가장 높음)이 있지만 토-일에는 크게 줄어 듭니다.
- 연중 특정 시간대 감소 (예 : 미국 공휴일 주변 방문 횟수 감소, 여름철 성장률 감소)
- 매년 상당한 성장
이 데이터를 사용하여 다가오는 연도를 예측하고 계절별로 월별 성장을 조정하는 데 사용할 수 있다면 좋을 것입니다. 월간보기로 나를 버리는 주요 사항은 다음과 같습니다.
- 어떤 달은 다른 달보다 월 / 화가 더 많을 것입니다 (그리고 그 기간도 일정하지 않습니다). 따라서 평일에 더 많은 월을 조정해야합니다.
연도에 따라 주 번호 매기기 시스템이 52-53에서 변경되므로 주 탐색도 어려워 보이지만 ts
처리하지 못하는 것 같습니다 .
나는 그 달의 주중 평균을 취하는 것을 숙고하고 있지만 결과 단위는 약간 이상합니다 (평균 주중 방문수의 성장). 그러면 유효한 데이터가 삭제됩니다.
나는 이런 종류의 데이터가 시계열에서 일반적이라고 생각합니다 (예 : 사무실 건물의 전기 사용량은 이와 같을 수 있습니다). 누구나 특히 R에서 모델링하는 방법에 대한 조언이 있습니까?
내가 작업하고있는 데이터는 매우 간단합니다.
[,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467
전반적인 성장 추세, 미국 공휴일 주일 전후 일부 감소, 여름에는 일반적으로 성장 둔화와 함께 현재와 같이 계속 이어집니다.
ts
( msts
정확히 달력은 실제로 추측합니다). 아니면, 나는 그 일을하는 방법을 이해하지 못합니다 ...