시계열 모델링을위한 상태 공간 모델과 칼만 필터의 단점은 무엇입니까?


53

상태 공간 모델과 KF의 모든 좋은 특성을 감안할 때 상태 공간 모델링의 단점 과 Kalman Filter (또는 EKF, UKF 또는 입자 필터)를 사용하여 추정 할 때의 단점 은 무엇 입니까? ARIMA, VAR 또는 ad / hoc / heuristic 방법과 같은 기존의 방법론을 살펴 보겠습니다.

교정하기가 어렵습니까? 모델 구조의 변화가 예측에 어떤 영향을 미치는지 이해하기가 복잡하고 어렵습니까?

또는 다른 방법으로는 상태 공간 모델에 비해 기존 ARIMA, VAR의 장점은 무엇입니까?

상태 공간 모델 의 장점 만 생각할 수 있습니다 .

  1. 정적 모델의 구조적 브레이크, 시프트, 시변 파라미터를 쉽게 처리합니다. 이러한 파라미터를 상태 공간 모델의 동적 상태로 만들면 모델이 파라미터의 모든 시프트에 자동으로 조정됩니다.
  2. 누락 된 데이터를 매우 자연스럽게 처리하고 KF의 전환 단계를 수행하고 업데이트 단계를 수행하지 않습니다.
  3. 상태 공간 모델 자체 (즉, 잡음 및 전이 / 관측 행렬의 공분산)의 즉석 매개 변수를 변경할 수 있으므로 현재 관측치가 다른 관측치와 약간 다른 출처에서 나온 경우이를 수행하지 않고도 추정에 쉽게 통합 할 수 있습니다. 특별한 것;
  4. 위의 속성을 사용하면 불규칙한 간격의 데이터를 쉽게 처리 할 수 ​​있습니다. 관측 간격에 따라 매번 모델을 변경하거나 규칙적인 간격을 사용하고 관측없는 간격을 누락 된 데이터로 처리합니다.
  5. 동일한 모델에서 다른 소스의 데이터를 동시에 사용하여 하나의 기본 수량을 추정 할 수 있습니다.
  6. 해석 할 수없는 여러 동적 구성 요소 로 모델을 구성하고 추정 할 수 있습니다.
  7. 모든 ARIMA 모델은 상태 공간 형식으로 표현할 수 있지만 간단한 상태 공간 모델 만 ARIMA 형식으로 정확하게 표현할 수 있습니다.

1
J 첫 번째 요점에서 언급했듯이 여러 가지 수준의 시프트 및 특이 치를 쉽게 통합 할 수있는 추가 이점은 거의 없습니다. 내 경험상 ARIMA보다 상태 공간으로 구조적 휴식을 쉽게 식별 할 수 있습니다. 또한 외인성 변수의 비선형 효과를 쉽게 통합 할 수 있습니다. 시계열 데이터가 고정되어있을 필요는 없습니다.
예측 자

2
글쎄, 나는 언제든지 ARIMA에 대한 주 공간 모델을 취할 것입니다. 나는 두 가지 단점을 생각해 볼 수있다. a) ARIMA 모델의 해당 상태 공간 모델은 설계 행렬에서 불필요한 제로가 많다. ARIMA가 더 컴팩트하다고 주장 할 수 있습니다. b) ARIMA와 같은 형태로 묘사 될 수있는 분석 형태를 거의 갖지 않지만 전통적인 상태 공간에서는 어려울 수있는 비선형 / 비 가우시안 모델이 있습니다.
Cagdas Ozgenc

2
@Kochede Durbin과 Koopman은 많은 단점을 생각할 수 없었습니다. 그들은 환상적인 교과서에서 52 페이지 하단에 두 가지를 언급 했습니다 . 그리고 이러한 단점이 더 이상 사실이 아니라고 말하고 싶습니다.

2
몇 가지 질문이 있습니다. 시간 추세 변화를 명확하게 식별하고 추세가 변화하는 시점을보고합니까? 매개 변수 변경과 오류 분산 변경을 구분하고 이에 대해보고합니까? 사용자 지정 예측 변수 주변의 특정 리드 및 지연 효과를 감지하고보고합니까? 레벨 이동 / 현지 시간 추세가 선언되기 전에 그룹에서 최소값 수를 지정할 수 있습니까? 오차 분산이 변하는 시간에 대한 전력 변환의 필요성과 결정적인 시점을 구별합니까? ARMAX 모델은 이러한 모든 고려 사항에 적용됩니다.
IrishStat

1
완전성을 위해, 어떤 상황에서는 단점을 설명해야한다는 단점이 있습니다. 청중에 따라 다릅니다. 누군가 기술을 선택하는 것과 관련이 있거나 있어야하는 것으로 이것을 기각하고 싶다면 기쁘다.
Nick Cox

답변:


25

다음은 귀하의 의견에서 추출 할 수 있었던 몇 가지 예비 단점 목록입니다. 비판과 추가는 매우 환영합니다!

전반적으로 ARIMA에 비해 상태 공간 모델을 사용하면보다 복잡한 프로세스를 모델링하고 해석 가능한 구조를 가지며 데이터 불규칙성을 쉽게 처리 할 수 ​​있습니다. 그러나이를 위해 모델의 복잡성이 증가하고 교정이 어려워지고 커뮤니티 지식이 줄어 듭니다.

  1. ARIMA는 범용 근 사기입니다. 데이터의 실제 모델이 무엇인지 상관하지 않으며이 모델 을 근사화 하기 위해 범용 ARIMA 진단 및 피팅 도구를 사용합니다 . 다항식 곡선 피팅과 같습니다. 실제 함수가 무엇인지 상관하지 않으며 항상 어느 정도의 다항식으로 근사 할 수 있습니다.
  2. 상태 공간 모델에는 당연히 공정에 적합한 일부 합리적인 모델을 작성해야합니다 (추정을 향상시키기 위해 공정에 대한 사전 지식을 사용하는 것이 좋습니다). 물론 프로세스에 대한 아이디어가 없다면 항상 보편적 인 상태 공간 모델을 사용할 수 있습니다. 예를 들어 상태 공간 형태로 ARIMA를 나타냅니다. 그러나 원래 형태의 ARIMA는 불필요한 숨겨진 상태를 도입하지 않고 더욱 포용 적입니다.
  3. 매우 다양한 상태 공간 모델 공식 (ARIMA 모델 클래스보다 훨씬 풍부함)이 있기 때문에 이러한 모든 잠재적 모델의 거동은 잘 연구되지 않았으며 공식화 한 모델이 복잡한 경우 어떻게 작동하는지 말하기가 어렵습니다. 다른 상황에서. 물론 상태 공간 모델이 단순하거나 해석 가능한 구성 요소로 구성된 경우에는 그러한 문제가 없습니다. 그러나 ARIMA는 항상 동일하게 잘 연구 된 ARIMA이므로 복잡한 프로세스를 근사화하는 데 사용하더라도 동작을보다 쉽게 ​​예측할 수 있습니다.
  4. 상태 공간을 사용하면 복잡한 / 비선형 모델을 직접적이고 정확하게 모델링 할 수 있으므로 이러한 복잡한 / 비선형 모델의 경우 필터링 / 예측 안정성 (EKF / UKF 분기, 입자 필터 저하) 안정성에 문제가있을 수 있습니다. 복잡한 모델의 매개 변수를 보정하는 데 문제가있을 수도 있습니다. 계산 상 어려운 최적화 문제입니다. ARIMA는 단순하고 매개 변수가 적으며 (2 개의 노이즈 소스 대신 1 개의 노이즈 소스, 숨겨진 변수 없음) 교정이 더 간단합니다.
  5. 주 공간의 경우 통계 커뮤니티에는 ARIMA보다 커뮤니티 지식과 소프트웨어가 적습니다.

1
Kalman 필터가 단순한 이동 평균보다 성능이 우수하고 시계열 예측을위한 Exp 평활화가 명확한 실제 모델이없는 경우 실제 물리 예제 / 산업 애플리케이션에 대해 알고 있습니까? ? 대부분의 논문에서 성능은 매우 비슷해 보입니다 (그리고 학술 논문은 새롭고 독창적이며 복잡한 모델에 대해 긍정적 인 성능 편향이 있습니다). 대부분의 경우 클라 만 필터를 지정하는 데 필요한 적절한 선형 상태 시스템 모델 및 공분산 등에 대한 지식이 없습니다.
Mannaggia

사실입니다. 여전히 연습에 모범이 있습니다. 선형 회귀와 같은 일부 범용 모델이 있으면 매개 변수 상태를 Kalman Filter로 설정하고 동적으로 추정 할 수 있습니다. 물론 각 단계마다 모델을 다시 맞출 수도 있지만 단일 KF 업데이트보다 계산 비용이 훨씬 비쌉니다. 실제로 매개 변수가 실제로 시간이 지남에 따라 변하거나 모형이 실제 공정과 정확히 일치하지 않는 경우 모형을 더 잘 맞추고 성능을 향상시키는 데 도움이 될 수 있습니다.
Kochede

1
ARIMA에 대한 귀하의 게시물 이외의 범용 범용 근사치에 대한 참조를 찾을 수 없습니다. 하나만 알려 주시겠습니까?
H.

2
,이 고원의 분해 정리에서 다음과 @ 알렉스 예를 들어 여기를 참조 phdeconomics.sssup.it/documents/Lesson11.pdf
Kochede

1
상태 공간 모델이 더 일반적인 형식이며 ARIMA가 일부만 포함한다고 말할 수 있습니까?
Vickyyy

3

의견에 매우 좋은 몇 가지 질문에 대해 @IrishStat에게 감사드립니다. 질문에 대한 답변이 너무 길어서 의견으로 게시 할 수 없으므로 답변으로 게시합니다 (불행히도 주제의 원래 질문이 아닙니다).

질문 : " 시간 추세 변화를 명확하게 식별하고 추세가 변화하는 시점을보고합니까? 매개 변수 변경과 오류 분산 변화를 구분하여보고합니까? 사용자 주변의 특정 리드 및 지연 효과를 감지하고보고합니까? 전원이 시간에 결정적 포인트 대 어디에 오류 분산 변화를 변환에 대해 지정된 예측은? 하나는 필요 구별합니까? 선언 된 레벨 시프트 / 현지 시간 추세 전에 그룹에서 값의 최소 수를 지정할 수 있습니까? "

  1. 추세 변화 파악-가장 자연스럽게 추세 경사를 상태 변수 중 하나로 만들 수 있으며 KF는 지속적으로 전류 경사를 추정합니다. 그런 다음 어떤 경사 변화가 충분히 큰지를 결정할 수 있습니다. 또는 상태 공간 모델에서 기울기가 시간에 따라 변하지 않는 경우 표준 방식으로 필터링하는 동안 잔차를 테스트하여 모델이 중단 된시기를 확인할 수 있습니다.
  2. 매개 변수 변경 및 오류 분산의 변화를 구별 - 예, 분산은 다음 매개 변수 (상태) 중 하나가 될 수있는 가장 가능성이 변경된 모델의 가능성과 방법, 특히 데이터 변경에 따라 매개 변수입니다.
  3. 리드 / 래그 관계 감지-확실하지 않은 경우 지연된 변수를 상태 공간 모델에 포함시킬 수 있습니다. 지연 을 선택 하려면 지연이 포함 된 모델의 잔차를 테스트하거나 간단한 경우에는 모델을 공식화하기 전에 교차 상관을 사용하면됩니다.
  4. 필터링이 재귀 적으로 수행되기 때문에 1) 에서처럼 추세 변화를 결정하기 위해 임계 값 관측치 수를 지정하십시오. 자신에 대해 충분히 큰 임계 값 경사 변화뿐만 아니라 신뢰도를위한 관측치 수도 있습니다. 그러나 KF는 경사 추정뿐만 아니라이 추정에 대한 신뢰 대역 도 생성 하므로 신뢰 한계가 임계 값을 초과하면 경사가 크게 변경되었다고 결정할 수 있습니다 .
  5. 전력 변환의 필요성과 더 큰 분산의 필요성을 구별하십시오. 올바른 것을 이해하지 못하지만 필터링하는 동안 잔차를 테스트하여 더 큰 분산으로 여전히 정상인지 또는 약간 기울어 져서 변경 해야하는지 알 수 있다고 생각합니다 당신의 모델. 더 나은-모델의 이진 전환 상태로 만들면 KF는 가능성을 기반으로 자동으로 추정합니다. 이 경우 모델은 비선형이므로 필터링을 수행하려면 UKF가 필요합니다.

1

칼만 필터는 상태 역학 및 측정 오류가 소위 선형 가우스 가정 ( http://wp.me/p491t5-PS )을 따르는 경우 최적의 선형 2 차 추정량 입니다. 따라서 역학 및 측정 모델을 알고 선형 가우시안 가정을 ​​따르는 한 선형 이차 추정기 클래스에는 더 나은 추정기가 없습니다. 그러나 "실패한"칼만 필터 응용 프로그램에 대한 가장 일반적인 이유는 다음과 같습니다.

  1. 상태 역학 및 측정 모델에 대한 정확하지 않은 지식.

  2. 필터 초기화가 잘못되었습니다 (실제 시스템 상태와 일치하지 않는 초기 상태 추정 및 공분산 제공). 이는 WLS (Weighted Least Squares) 초기화 절차를 사용하여 쉽게 극복 할 수 있습니다.

  3. 시스템 역학 모델과 관련하여 통계적인 "이상 값"인 측정을 통합합니다. 이로 인해 Kalman Gain에 음의 요소가 생겨 업데이트 후 양의 반 정밀도 공분산 행렬로 이어질 수 있습니다. 이는 타원 게이팅과 같은 "게이팅"알고리즘을 사용하여 해당 측정으로 Kalman Filter를 업데이트하기 전에 측정의 유효성을 검사하지 않아도됩니다.

이것은 내가 칼만 필터와 함께 일하는 것으로 본 가장 일반적인 실수 / 문제 중 일부입니다. 그렇지 않으면 모형의 가정이 유효하면 칼만 필터가 최적의 추정량입니다.


1

훌륭한 베이지안 예측 및 동적 모델 (Harrison and West, 1997)을 참조 할 수 있습니다 . 저자는 거의 모든 전통적인 시계열 모델이 일반적인 동적 모델의 특정 사례임을 보여줍니다. 또한 장점을 강조합니다. 아마도 주요 장점 중 하나는 단순히 상태 벡터를 보강하여 많은 상태 공간 모델을 통합 할 수있는 용이성입니다. 예를 들어 회귀 분석기, 계절적 요인 및 자동 회귀 구성 요소를 단일 모델로 완벽하게 통합 할 수 있습니다.


"예를 들어 회귀 분석기, 계절적 요인 및 자동 회귀 구성 요소를 단일 모델로 완벽하게 통합 할 수 있습니까?"에 대해 더 자세히 설명 할 수 있습니까? 내가 틀렸다면 수정하십시오. ARIMA의 경우 시계열을 고정시켜야하지만 상태 공간 모델의 경우 상태 변수의 수만 조정하면됩니까?
Vickyyy

@Vickyyy ARIMA와 달리 상태 공간 모델은 정상 성을 가정하지 않습니다. 많은 컴포넌트를 추가하고 단일 상태 벡터로 나타낼 수 있습니다.
Anselmo

1

State Space 함수를 직접 사용한다면 모델을 구성하는 여러 매트릭스와 이들이 상호 작용하고 작동하는 방식을 이해해야 할 것입니다. ARIMA 모델을 정의하는 것보다 프로그램을 정의하는 것과 훨씬 비슷합니다. 동적 상태 공간 모델로 작업하는 경우 훨씬 복잡해집니다.

정말 멋진 State Space 기능이있는 소프트웨어 패키지를 사용하는 경우이 중 일부를 피할 수 있지만 R 패키지에서 이러한 기능의 대부분은 특정 시점에 세부 정보로 이동해야합니다.

제 생각에 그것은 일반적으로 베이지안 통계와 매우 비슷합니다.이 기계는보다 빈번한 기능보다 더 많은 이해, 관리 및 사용을 필요로합니다.

두 경우 모두 추가 정보 / 지식의 가치는 있지만 채택에 장애가 될 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.