시계열 교차 유효성 검사로 예측 오류 계산


13

시계열에 대한 예측 모델이 있으며 샘플 외부 예측 오류를 계산하려고합니다. 현재 내가 따르고있는 전략은 Rob Hyndman의 블로그 (페이지 하단 근처)에서 제안 된 것입니다 (시계열 및 크기 의 훈련 세트를 가정 )y1,,ynk

  1. 데이터에 모델을 장착 및하자 다음 관찰에 대한 예측합니다.yt,,yt+k1y^t+k
  2. 예측 오류를 .et=y^t+kyt+k
  3. 대해 반복t=1,,nk
  4. 평균 제곱 오차를MSE=1nkt=1nket2

내 질문은 겹치는 트레이닝 세트로 인해 상관 관계에 대해 얼마나 걱정해야하는지입니다. 특히 다음 값뿐만 아니라 다음 값도 예측하려고하므로 예측이 있습니다. 및 오류 이며 예측 오류의 용어 구조를 구성하고 싶습니다.my^t+k,,y^t+k+m1et,1,,et,m

매번 1 씩 트레이닝 세트 창을 롤 포워드 할 수 있습니까, 아니면 롤 포워드해야 합니까? 내가 예측하고있는 일련의 유의 한 자기 상관이있는 경우 이러한 질문에 대한 답은 어떻게 변하는가? (아마도 긴 메모리 과정 인 것이다.m

여기에 대한 설명이나 MSE 주변의 신뢰 구간 (또는 기타 오류 측정 값)에 대한 이론적 결과를 찾을 수있는 곳으로 연결되는 링크에 감사드립니다.

답변:


11

교차 검증이 아닌 최대 엔트로피 부트 스트랩을 사용하여 오류를 추정하는 데 더 관심이있는 것 같습니다. 이를 통해 데이터의 여러 부트 스트랩을 생성 할 수 있으며, 예측에 대한 신뢰 구간을 계산하기 위해 원하는 수의 트레인 / 테스트 세트로 분할 할 수 있습니다.

Rob Hyndman은 자신의 블로그 에서 시계열 교차 검증에 대해 좀 더 자세히 논의하고 있으며 , 여기에서 여러 가지 "롤링"및 예측 방법을 구현하지만 주로 구현에 중점을 둡니다. 좀이 내 블로그에 더 구현을 뿐만 아니라. 어쩌면 가장 간단한 방법은 모든 시간 창에서 오류를 평균화하여 오류의 잠재적 상관 관계를 무시하고 무시하는 것입니다.

내가 알 수있는 한, 시계열 데이터에 대한 이론적 교차 검증 상태는 일반적인 교차 검증의 이론적 상태보다 다소 뒤 떨어진다. 직관적으로, 수평선이 증가함에 따라 오류가 증가 할 것으로 예상하므로 다양한 예측 영역에서 상관 된 오류를 예상해야합니다. 왜 이것이 당신을 걱정합니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.