자기 상관을 테스트하는 대신 Durbin-Watson을 사용하는 이유는 무엇입니까?


10

Durbin-Watson 테스트는 지연 1에서 잔차의 자기 상관을 테스트합니다. 그러나 지연 1에서 자기 상관을 직접 테스트합니다. 또한, 지연 2,3,4에서 자기 상관을 테스트 할 수 있으며 여러 지연에서 자기 상관에 대한 좋은 portmanteau 테스트가 있으며 훌륭하고 쉽게 해석 할 수있는 그래프를 얻을 수 있습니다 (예 : R의 acf () 함수). Durbin-Watson은 이해하기 쉽고 직관적이지 않은 결과를 낳습니다. 왜 그것을 사용합니까?

이것은 더빈-왓슨 (Durbin-Watson) 테스트의 결론에 대한 이 질문 에서 영감을 얻었 지만 분명히 분리되어 있습니다.


1
실제로 다른 지연에 대해서는 Durbin-Watson을 수행 할 수 있습니다. 일반화 된 Durbin-Watson 통계를 찾아보십시오.
Brandon Sherman

답변:


8

이 스레드와 다른 스레드에서 이전에 지적한 바와 같이 : (1) Durbin-Watson 테스트는 결정적이지 않습니다. Durbin과 Watson이 처음 제안한 경계는 정확한 분포가 관측 된 회귀 행렬에 의존하기 때문입니다. 그러나 지금까지는 통계 / 경제학 소프트웨어에서 해결하기에 충분히 쉽습니다. (2) Durbin-Watson 테스트는 더 높은 지연으로 일반화되었습니다. 따라서 지연의 결론이나 제한이 Durbin-Watson 테스트에 대한 논쟁이 아닙니다.

지연 종속 변수의 Wald 검정과 비교하여 Durbin-Watson 검정은 특정 모델에서 더 높은 검정력을 가질 수 있습니다. 특히 모형에 결정 론적 추세 나 계절 패턴이 포함되어 있으면 지연된 응답 (결정 론적 패턴에 대해 아직 조정되지 않은 응답)을 포함하는 것보다 더빈-왓슨 테스트 에서처럼 잔차의 자기 상관을 테스트하는 것이 좋습니다. . 아래에 작은 R 시뮬레이션이 포함되어 있습니다.

Durbin-Watson 테스트의 중요한 단점 중 하나는 이미 자기 회귀 효과가 포함 된 모델에 적용해서는 안된다는 것입니다. 따라서 잔차 자기 상관을 자기 회귀 모델에서 부분적으로 캡처 한 후 잔존 자기 상관을 테스트 할 수 없습니다. 이 시나리오에서 Durbin-Watson 검정의 성능은 Breusch-Godfrey 검정의 경우와 같이 완전히 분해 될 수 있습니다. 우리의 책 "Applied Econometrics with R"은 "자체 분석 프로그램"장에서 이것을 보여주는 작은 시뮬레이션 연구를 가지고 있습니다. http://eeecon.uibk.ac.at/~zeileis/teaching/AER/ 참조 .

경향과 자기 상관 오차가있는 데이터 세트의 경우 Durbin-Watson 검정의 검정력은 Breusch-Godfrey 검정보다 높고 Wald 검정의 자기 회귀 효과에 비해 높습니다. R의 간단한 작은 시나리오에 대해 이것을 설명합니다. 그런 모델에서 50 개의 관측 값을 그리고 세 가지 테스트 모두에 대한 p- 값을 계산합니다.

pvals <- function()
{
  ## data with trend and autocorrelated error term
  d <- data.frame(
    x = 1:50,
    err = filter(rnorm(50), 0.25, method = "recursive")
  )

  ## response and corresponding lags
  d$y <- 1 + 1 * d$x + d$err
      d$ylag <- c(NA, d$y[-50])

  ## OLS regressions with/without lags
  m <- lm(y ~ x, data = d)
  mlag <- lm(y ~ x + ylag, data = d)

  ## p-value from Durbin-Watson and Breusch-Godfrey tests
  ## and the Wald test of the lag coefficient
  c(
    "DW" = dwtest(m)$p.value,
        "BG" = bgtest(m)$p.value,
    "Coef-Wald" = coeftest(mlag)[3, 4]
  )
}

그런 다음 세 가지 모델 모두에 대해 1000 개의 p- 값을 시뮬레이션 할 수 있습니다.

set.seed(1)
p <- t(replicate(1000, pvals()))

Durbin-Watson 테스트는 평균 p- 값이 가장 낮습니다

colMeans(p)
##        DW        BG Coef-Wald 
## 0.1220556 0.2812628 0.2892220 

그리고 5 % 유의 수준에서 최고 전력 :

colMeans(p < 0.05)
##        DW        BG Coef-Wald 
##     0.493     0.256     0.248 

따라서 DW 통계량의 또 다른 한계는 모델이 이미 자기 상관을 제어하려고 시도 할 경우 사용할 수 없다는 것입니다. DW가 Wald 나 Breusch-Godfrey (내가 사용하지 않은 것)보다 더 많은 힘을 가지고 있다는 사실에 감사하지만, 평소 비교는 Ljung-Box와 같은 포트만 토 테스트와 0의 null에 비해 개별 자기 상관과 비교됩니다. 그것은 교과서를 예측하는 전형적인 체제입니다.
zbicyclist

2
실제로 다른 제한 IMO가 아니라 주요 제한입니다. 다른 문제들 (경계 및 지연 수보다는 p- 값의 계산)을 다룰 수 있습니다. 그리고 전력 해석에주의하십시오 : 나는이 특정 모델-AR (1) 오류 항을 가진 결정 론적 경향-Durbin-Watson 검정이 더 높은 검정력을 가지고 있다고 말했습니다. 다른 설정에서는 그렇지 않을 수 있습니다. Ljung-Box 테스트의 경우 : 예, 이것은 ARIMA 모델을 피팅 한 후 남아있는 자기 상관을 확인하는 클래식 테스트입니다.
Achim Zeileis

3

Durbin-Watson 검정은 자기 상관을 검정하는 방법입니다. ACF를 플로팅하는 것은 정규성을 테스트하기 위해 QQ 플롯을 만드는 것과 같습니다. 정규성을 테스트하기 위해 QQ 플롯을 볼 수있는 것이 유용하지만, Kolmogorov-Smirnov 또는 Levene 테스트는 정규성에 대한 가설 테스트가 더 결정적이므로 플롯에 표시되는 내용을 보완합니다.

다중 지연과 관련하여 일반화 된 Durbin-Watson 통계량을 사용하고 몇 가지 가설 검정을 실행하고 Bonferroni 보정을 수행하여 다중 검정을 수정할 수 있습니다. Breusch-Godfrey 테스트를 실행할 수도 있습니다. 이 테스트는 모든 주문 의 상관 관계가 있는지 테스트합니다 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.