Kalman 필터를 사용하여 시계열의 결 측값 대치


12

Kalman Filters를 사용하여 시계열 데이터에서 결 측값을 대치하는 방법에 관심이 있습니다. 일부 연속 시점이 누락 된 경우에도 적용 가능합니까? 나는이 주제에서 많은 것을 찾을 수 없다. 모든 설명, 의견 및 링크를 환영합니다.


이 게시물에 관심 있을 수 있습니다 . Kalman 필터를 통해 결 측값을 대치하기 위해 ARIMA 모델의 상태 공간 표현을 기반으로 한 예를 제공합니다.
javlacalle

@ javlacalle 감사합니다, 나는 이미이 게시물을 알고 있으며 구체적인 구현을위한 훌륭한 예입니다. 그러나 나는 오히려 이론적 배경에 관심이 있습니다.
GS9

답변:


9

예비 : 칼만 필터링 :

칼만 필터는 다음과 같은 형식의 상태 공간 모델에서 작동합니다 (작성 방법은 여러 가지가 있습니다. Durbin 및 Koopman (2012)을 기반으로하는 쉬운 방법입니다. 다음은 모두이 책을 기반으로합니다).

yt=Zαt+εtεtN(0,H)αt1=Tαt+ηtηtN(0,Q)α1N(a1,P1)

여기서 는 관측 된 계열이지만 누락 된 값이있을 수 있지만 는 완전히 관찰되지 않습니다. 첫 번째 방정식 ( "측정"방정식)은 관찰 된 데이터가 특정 방식으로 관찰되지 않은 상태와 관련이 있다고 말합니다. 두 번째 방정식 ( "전환"방정식)은 관찰되지 않은 상태가 특정 방식으로 시간이 지남에 따라 진화한다고 말합니다.α tytαt

Kalman 필터는 최적의 추정값을 찾기 위해 작동합니다 ( 는 Normal : 이므로 Kalman 필터가 실제로하는 것은 분포의 조건부 평균과 분산을 계산하는 것입니다 시간 에 대한 관측치에 대한 조건부 ).α t α tN ( a t , P t ) α t tαtαtαtN(at,Pt)αtt

일반적인 경우 (관측 가능할 때)에서, 칼만 필터는 현재 상태의 추정치 및 현재 관측 사용 다음 상태를 추정 할 수있는 최선 할 과 같은 다음 :ytαt+1

at+1=Tat+Kt(ytZαt)Pt+1=TPt(TKtZ)+Q

여기서 는 "칼만 이득"입니다.Kt

관측치가없는 경우 Kalman 필터는 여전히 최상의 방법으로 및 을 계산하려고합니다 . 이후 사용할 수 없습니다, 그것은 측정 방정식을 사용하지 수 있지만, 여전히 전환 방정식을 사용할 수 있습니다 . 따라서 가 없으면 Kalman 필터는 대신 다음을 계산합니다.at+1Pt+1ytyt

at+1=TatPt+1=TPtT+Q

본질적으로 가 주어지면 데이터가없는 최선의 추측 은 전환 방정식에 지정된 진화 일뿐입니다. 누락 된 데이터가있는 여러 기간 동안이 작업을 수행 할 수 있습니다.α t + 1αtαt+1

데이터 가있는 경우 , 첫 번째 필터링 방정식 세트는 데이터없이 최상의 추측을 취하고 이전 추정치의 수준에 따라 "정정"을 추가합니다.yt


대치 데이터 :

Kalman 필터가 전체 시간 범위에 적용되면 에 대한 상태 의 최적 추정치를 됩니다 . 측정 방정식을 통해 데이터 대치가 간단 해집니다. 특히, 당신은 단지 계산 : t = 1 , 2 , , Tat,Ptt=1,2,,T

y^t=Zat

참고로 Durbin and Koopman (2012)은 훌륭합니다. 섹션 4.10에서는 누락 된 관측치에 대해 설명합니다.

  • S. Durbin, J. & SJ (2012). 상태 공간 방법에 의한 시계열 분석 (No. 38). 옥스포드 대학 출판부.

더 부드러운 솔루션을 사용하면 대치하는 것이 더 의미가있을 것입니다 (이미 존재하는 모든 데이터가 있기 때문에 미래의 값에도 정보를 사용하지 않는 이유)
Juho Kokkala

0

javlacalle 이 댓글에서 가리키는 게시 의 예는 연속 누락 된 시점을 특징으로합니다. 또한이 State Space 논문 에 섹션 2.1에 나와 있는 계산 된 대치 된 (견본 내) 값 주위의 간격에 관심이있을 수도 있습니다 .

흥미로운 또 다른 논문은 이것 입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.