Google 트렌드는 매주 데이터를 반환하므로 매일 / 매월 데이터와 데이터를 병합하는 방법을 찾아야합니다.
내가 지금까지 한 일은 각 serie를 매일 데이터로 나누는 것입니다.
에서:
2013-03-03-2013-03-09 37
에:
2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37
그러나 이것은 내 문제에 많은 복잡성을 추가하고 있습니다. 지난 6 개월 값 또는 월간 데이터의 6 값에서 Google 검색을 예측하려고했습니다. 일일 데이터는 180 개의 과거 값에 대한 작업을 의미합니다. (저는 10 년의 데이터를 가지고 있으므로 월별 데이터는 120 포인트 / 주간 데이터는 500 + / 일일 데이터는 3500 +입니다)
다른 방법은 일별 데이터를 주별 / 월별 데이터로 "병합"하는 것입니다. 그러나이 과정에서 몇 가지 의문이 생깁니다. 합계가 무언가를 나타 내기 때문에 일부 데이터를 평균화 할 수 있습니다. 예를 들어, 강우량은 특정주의 비의 양은 주를 구성하는 각 일의 양의 합계입니다.
제 경우에는 가격, 금리 및 기타 것들을 다루고 있습니다. 가격은 거래량을 고려하는 것이 일반적이기 때문에 주간 데이터는 가중 평균이됩니다. 재무 요율의 경우 일일 요율에서 주간 요율을 작성하기 위해 일부 공식이 조금 더 복잡합니다. 다른 것들에 대해서는 기본 속성을 모릅니다. 나는 그러한 속성들이 의미없는 지표를 피하기 위해 중요하다고 생각한다 (예를 들어, 평균 금융 요금은 의미가 없다).
따라서 세 가지 질문이 있습니다.
알려 지거나 알려지지 않은 속성의 경우 매일 데이터를 매주 / 매월 데이터로 이동하려면 어떻게해야합니까?
실생활에서 의미가없는 양을 소개하기 때문에 매주 / 매월 데이터를 매일 수행 한 것처럼 매일 데이터로 나누는 것이 다소 잘못되었다고 생각합니다. 거의 같은 질문입니다.
알려 지거나 알려지지 않은 속성의 경우 주별 / 월별 데이터에서 일일 데이터로 어떻게 진행해야합니까?
마지막으로, 시간 단계가 다른 두 개의 시계열이 주어지면 더 나은 방법은 무엇입니까? 최저 또는 최대 시간 단계 사용? 나는 이것이 데이터 수와 모델의 복잡성 사이의 타협이라고 생각하지만 그 옵션 중에서 선택할 강력한 논거는 보이지 않습니다.
편집 : 쉽게 할 수있는 도구 (R Python에서도 Excel)를 알고 있다면 매우 높이 평가됩니다.