VAR 모델이 정지 데이터보다 정지 데이터에서 더 잘 작동하는 이유는 무엇입니까?


9

파이썬의 statsmodels VAR 라이브러리를 사용하여 재무 시계열 데이터를 모델링하고 일부 결과가 혼란 스럽습니다. VAR 모델은 시계열 데이터가 정지되어 있다고 가정합니다. 나는 두 개의 다른 유가 증권에 대해 고정식이 아닌 일련의 로그 가격에 실수로 적합했으며 놀랍게도 적합하지 않은 값과 샘플 내 예측은 상대적으로 중요하지 않은 고정 잔차로 매우 정확했습니다. 표본 내 예측 의 는 99 %이고 예측 잔차 계열의 표준 편차는 예측 값의 약 10 %입니다.R2

그러나 로그 가격을 차분하고 해당 시계열을 VAR 모델에 맞추면 적합치 및 예측 값이 평균을 훨씬 뛰어 넘는 범위에서 튀어 나오게됩니다. 결과적으로 잔차는 적합치보다 로그 리턴을 예측하는 작업이 더 잘 이루어지며 예측 잔차의 표준 편차는 적합치 데이터 계열보다 15X 더 큰 예측 계열의 .007 값 보다 큽니다 .R2

VAR 모델에서 적합치 대 잔차를 잘못 해석하거나 다른 오류가 발생합니까? 고정되지 않은 시계열이 동일한 기본 데이터를 기반으로하는 고정식 시계보다 정확한 예측을하는 이유는 무엇입니까? 나는 같은 파이썬 라이브러리의 ARMA 모델로 좋은 일을 했고이 모델링 단일 시리즈 데이터와 같은 것을 보지 못했습니다.


5
두 가지 사실 : (1) 다른 임의의 보행에서 하나의 임의 보행을 회귀하고 정상 성을 잘못 가정 할 때 , 그들은 독립적 인 프로세스 일지라도 거의 항상 통계적으로 유의미한 결과를 얻습니다 ! . (2) 두 변수가 공분산 되면 한 변수를 다른 변수에 회귀시킬 수 있으며 추정기는 일반적인 일관성 회귀보다 빠르게 수렴합니다. 결과는 초 일관성입니다.
Matthew Gunn

대단히 감사합니다. 사실 # 1은 고정식이 아닌 시리즈의 결과를 반드시 설명합니다. 고정 시리즈의 결과는 분명히 내가 말할 수있는 한 두 시리즈가 함께 통합되지 않는다는 것을 제외하고는 당신이 초 일관성이라는 것을 보여주는 것처럼 행동합니다. 두 가격대에서 선형 회귀 분석을 실행했으며 잔차는 고정되지 않았습니다. 따라서 두 개의 리턴 시리즈가 자동 교차 상관 관계가 없기 때문에 VAR 모델이 너무 나쁘게 예측한다고 가정해야합니다. 그레인저 테스트도 그 사실을 확인합니다.
jpeginternet

@ MatthewGunn, 귀하의 의견이 답변으로 더 적합 할 수 있습니다.
Richard Hardy

답변:


9

두 가지 사실 :

  1. 하나의 임의의 보행을 다른 임의의 보행에서 회귀하고 정상 성을 잘못 가정하면 소프트웨어는 일반적으로 독립적 인 프로세스 인 경우에도 통계적으로 유의미한 결과를 내뱉습니다 ! 예를 들어, 이 강의 노트를 참조하십시오. (의심스러운 무작위 걷기와 수많은 링크를위한 Google이 올 것입니다.) 무엇이 잘못 되었나요? 일반적인 OLS 추정 및 표준 오류는 랜덤 보행의 경우에 맞지 않는 가정을 기반으로합니다.

    일반적인 OLS 가정을 적용하고 서로에 대해 두 개의 독립적 인 랜덤 보행을 회귀시키는 것은 일반적으로 거대한 , 매우 중요한 계수를 갖는 회귀를 야기 할 것이며 , 이는 모두 완전히 가짜입니다! 임의의 보행이 있고 수준으로 회귀를 실행하면 OLS에 대한 일반적인 가정이 위반되고 추정치가 로 수렴되지 않으며 일반적인 중앙 한계 정리가 적용되지 않으며 t-stats 및 p- 값 회귀 침이 모두 잘못되었습니다 .R2t

  2. 두 변수가 함께 적분 되면 한 변수를 다른 변수로 회귀시킬 수 있으며 추정기는 일반적인 일관성 회귀보다 더 빨리 수렴합니다. 결과는 초 일관성입니다. 예 : 체크 아웃 존 코크의 시계열 온라인 예약 및 검색 "superconsistent."

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.