Kalman Filters를 사용하여 시계열 데이터에서 결 측값을 대치하는 방법에 관심이 있습니다. 일부 연속 시점이 누락 된 경우에도 적용 가능합니까? 나는이 주제에서 많은 것을 찾을 수 없다. 모든 설명, 의견 및 링크를 환영합니다.
Kalman Filters를 사용하여 시계열 데이터에서 결 측값을 대치하는 방법에 관심이 있습니다. 일부 연속 시점이 누락 된 경우에도 적용 가능합니까? 나는이 주제에서 많은 것을 찾을 수 없다. 모든 설명, 의견 및 링크를 환영합니다.
답변:
예비 : 칼만 필터링 :
칼만 필터는 다음과 같은 형식의 상태 공간 모델에서 작동합니다 (작성 방법은 여러 가지가 있습니다. Durbin 및 Koopman (2012)을 기반으로하는 쉬운 방법입니다. 다음은 모두이 책을 기반으로합니다).
여기서 는 관측 된 계열이지만 누락 된 값이있을 수 있지만 는 완전히 관찰되지 않습니다. 첫 번째 방정식 ( "측정"방정식)은 관찰 된 데이터가 특정 방식으로 관찰되지 않은 상태와 관련이 있다고 말합니다. 두 번째 방정식 ( "전환"방정식)은 관찰되지 않은 상태가 특정 방식으로 시간이 지남에 따라 진화한다고 말합니다.α t
Kalman 필터는 최적의 추정값을 찾기 위해 작동합니다 ( 는 Normal : 이므로 Kalman 필터가 실제로하는 것은 분포의 조건부 평균과 분산을 계산하는 것입니다 시간 에 대한 관측치에 대한 조건부 ).α t α t ∼ N ( a t , P t ) α t t
일반적인 경우 (관측 가능할 때)에서, 칼만 필터는 현재 상태의 추정치 및 현재 관측 사용 다음 상태를 추정 할 수있는 최선 할 과 같은 다음 :
여기서 는 "칼만 이득"입니다.
관측치가없는 경우 Kalman 필터는 여전히 최상의 방법으로 및 을 계산하려고합니다 . 이후 사용할 수 없습니다, 그것은 측정 방정식을 사용하지 수 있지만, 여전히 전환 방정식을 사용할 수 있습니다 . 따라서 가 없으면 Kalman 필터는 대신 다음을 계산합니다.
본질적으로 가 주어지면 데이터가없는 최선의 추측 은 전환 방정식에 지정된 진화 일뿐입니다. 누락 된 데이터가있는 여러 기간 동안이 작업을 수행 할 수 있습니다.α t + 1
데이터 가있는 경우 , 첫 번째 필터링 방정식 세트는 데이터없이 최상의 추측을 취하고 이전 추정치의 수준에 따라 "정정"을 추가합니다.
대치 데이터 :
Kalman 필터가 전체 시간 범위에 적용되면 에 대한 상태 의 최적 추정치를 됩니다 . 측정 방정식을 통해 데이터 대치가 간단 해집니다. 특히, 당신은 단지 계산 : t = 1 , 2 , … , T
참고로 Durbin and Koopman (2012)은 훌륭합니다. 섹션 4.10에서는 누락 된 관측치에 대해 설명합니다.
javlacalle 이 댓글에서 가리키는 게시 의 예는 연속 누락 된 시점을 특징으로합니다. 또한이 State Space 논문 에 섹션 2.1에 나와 있는 계산 된 대치 된 (견본 내) 값 주위의 간격에 관심이있을 수도 있습니다 .
흥미로운 또 다른 논문은 이것 입니다.