제과점의 과거 판매 데이터가 있습니다 (매일, 3 년 이상). 이제 주중, 날씨 변수 등과 같은 기능을 사용하여 향후 판매를 예측하는 모델을 만들고 싶습니다.
모델 피팅 및 평가를 위해 데이터 세트를 어떻게 분할해야합니까?
- 시간순으로 기차 / 검증 / 테스트 분할해야합니까?
- 그런 다음 열차 및 검증 세트로 하이퍼 파라미터 튜닝을 수행합니까?
- (중첩 된) 교차 검증이 시계열 문제에 대한 나쁜 전략입니까?
편집
다음은 @ ene100에서 제안한 URL을 따른 후 나온 몇 가지 링크입니다.
- 이론 과 실제 에서 "롤링 예측 원점"을 설명하는 Rob Hyndman (R 코드 포함)
- 롤링 예측 원점에 대한 다른 용어 는 " 도면 앞으로 최적화"( 여기 또는 여기 ), "롤링 지평"또는 "이동 원점"입니다.
- “이러한 기술에 대한 수요와 반성이 불분명하기 때문에”( 여기에 설명되어 있음 ) 가까운 시일 내에 이러한 기술이 사이키 학습에 통합되지 않는 것 같습니다 .
그리고 이것은 시계열 교차 검증에 대한 또 다른 제안입니다.