지수 평활 모델에서 누락 된 데이터 처리


14

지수 평활 모형의 맥락에서 누락 된 데이터를 처리하는 표준 방법은없는 것 같습니다. 특히, 예측 패키지 에서 ets 라고하는 R 구현은 데이터 손실없이 가장 긴 하위 시퀀스를 취하는 것으로 보이며 Hyndman et al. 누락 된 데이터에 대해 전혀 이야기하지 않는 것 같습니다.

사용자가 명시 적으로 요청하면 (그리고 누락 된 데이터가 너무 가깝거나 계절에 관계없이 너무 많은 기간에 발생하지 않는 경우) 조금 더하고 싶습니다. 특히, 내가 생각하는 것은 다음과 같습니다. 시뮬레이션 중에 누락 된 값 가 발생할 때마다 되도록와이 대신 현재 점 예측 와이~ 을 대체합니다 . 예를 들어, 이는 데이터 포인트가 매개 변수 최적화 프로세스에 고려되지 않도록합니다.와이ε=0

모수에 대해 적합하게 적합하면 오류의 표준 편차 (평균 으로 정상이라고 가정)를 추정하고 해당 분포에서 생성 된 값을 사용 하더라도 가능성이 큰 요인으로 감소하지 않는지 확인할 수 있습니다. 예측 (시뮬레이션 사용)에도 이러한 값을 사용합니다.0ϵ

이 방법으로 알려진 함정이 있습니까?


지수 공분산 커널과 함께 가우스 프로세스 사용을 고려 했습니까? 누락 된 데이터를 처리하고 신뢰 구간을 도출하는 자연스러운 방법 인 것 같습니다. R에는 GPFit 패키지가 있습니다.
LE Rogerson

답변:


2

당신의 접근 방식은 의미가 있습니다. 내가 몇 년 동안 관련 소프트웨어의 상용 소프트웨어가 정확히 이것을 수행했습니다.

개요는 단일 지수 평활 (SES)에 적용되지만 물론 추세 또는 계절 성분에 동일한 처리를 적용 할 수 있습니다. 계절에 따라 업데이트와 마찬가지로 전체 계절 주기로 되돌아 가야합니다.

물론 다른 대안은 결 측값을 단순히 보간하는 것입니다. 이 최신 버전의 옵션입니다 ets(..., na.action="na.interp").

상태 공간 모델에 대해 내가 아는 바가 없기 때문에 누락 된 데이터를 관찰되지 않은 것으로 취급하는 것은 지나치게 어렵지 않습니다. 왜 이것이 forecast패키지에 구현되어 있지 않은지 잘 모르겠습니다 . Rob Hyndman의 블로그를 통한 빠른 검색 은 실제로 유용한 것을 얻지 못했습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.