잔차의 자기 상관을 테스트하는 방법은 무엇입니까?


23

가격이 많은 두 개의 열이있는 행렬이 있습니다 (750). 아래 이미지에서 나는 선형 선형 회귀의 잔차를 플로팅했습니다.

lm(prices[,1] ~ prices[,2])

이미지를 보면 잔차의 매우 강한 자기 상관 인 것 같습니다.

그러나 이러한 잔차의 자기 상관이 강한 지 어떻게 테스트 할 수 있습니까? 어떤 방법을 사용해야합니까?

선형 회귀의 잔차

고맙습니다!


8
자기 상관을 테스트 할 필요가 없습니다. 저기있어. 줄거리는 그것을 보여줍니다. 이러한 잔차의 자기 상관 함수 (function acf())를 살펴볼 수 있지만, 이는 눈으로 볼 수있는 것을 간단히 확인할 수 있습니다. 지연된 잔차 간의 상관 관계는 매우 높습니다.
Wolfgang

@ 울프 강, 예, 맞습니다. 그러나 프로그래밍 방식으로 확인해야합니다. acf 기능을 살펴 보겠습니다. 감사!
Dail

@ Wolffgang, 나는 acf ()를보고 있지만 강한 상관 관계가 있는지 이해하기 위해 일종의 p 값을 보지 못합니다. 결과를 해석하는 방법? 감사합니다
Dail

H0 : 상관 (r) = 0 인 경우 r은 평균 0과 sqrt (관측치 수)의 분산으로 법선 / t 거리를 따릅니다. +/-를 사용하여 95 % 신뢰 구간을 얻을 수 있습니다.qt(0.75, numberofobs)/sqrt(numberofobs)
Jim

@Jim 상관의 분산이 이 아닙니다 . 표준 편차 도 아닙니다 . 그러나 여기에는 이 있습니다. nnn
Glen_b-복귀 모니카

답변:


17

이 작업을 수행하는 방법 은 여러 가지가 있지만 가장 먼저 떠오르는 것은 선형 회귀를 기반으로합니다. 연속 잔차를 서로 회귀시키고 상당한 기울기를 테스트 할 수 있습니다. 자동 상관이있는 경우 연속 잔차간에 선형 관계가 있어야합니다. 작성한 코드를 완료하려면 다음을 수행하십시오.

mod = lm(prices[,1] ~ prices[,2])
res = mod$res 
n = length(res) 
mod2 = lm(res[-n] ~ res[-1]) 
summary(mod2)

mod2는 시간 오류 에 대한 시간 오류 의 선형 회귀입니다 . res [-1]의 계수가 유의하면 잔차의 자기 상관 증거가 있습니다.tεt1ε1

참고 : 이것은 예측할 때 만 중요하다는 의미에서 잔차가 자동 회귀 적이라고 가정합니다 . 실제로는 더 긴 범위 종속성이있을 수 있습니다. 이 경우, 내가 설명한이 방법은 의 실제 자기 상관 구조에 대한 단일 지연 자동 회귀 근사로 해석해야합니다 .ε1εε


예를 들어 주셔서 감사합니다. 단 하나의 의심, res [-1]이 중요한지 어떻게 테스트 할 수 있습니까?
Dail

다른 회귀 계수와 같은 방식으로 검정합니다. 통계량 및 값을보십시오p
Macro

다음과 같이 빠른 테스트를 수행합니다. lm (rnorm (1000) ~ jitter (1 : 1000)) 나는 얻는다 : 잔여 표준 오차 : 997 자유도에서 1.006 다중 R- 제곱 : 0.0003463, 조정 된 R- 제곱 : -0.0006564 F- 통계 : 1 및 997 DF에서 0.3454, p- 값 : 0.5569 p- 값은 귀무 가설을 기각 할 수 없습니다
Dail

매크로, 위에서 설명한 차트의 잔차를 테스트했으며 결과는 다음과 같습니다. 잔차 표준 오류 : 자유도 747에서 0.04514 다중 R- 제곱 : 0.9241, 조정 된 R- 제곱 : 0.924 F- 통계 : 1에 9093 747 DF, p-value : <2.2e-16, 아주 좋지 않은 것 같습니다. 강한 자기 상관이 있기 때문에 매우 이상합니다. 어떻게해야합니까?
Dail

3
이를 자기 상관을위한 Breusch-Godfrey 테스트라고합니다.
찰리

16

lmtest 패키지에 구현 된 Durbin-Watson test를 사용하십시오 .

dwtest(prices[,1] ~ prices[,2])

매우 이상합니다. p-value <2.2e-16, 어떻게 가능합니까? 데이터는 매우 상관있는 것 같습니다!
Dail

4
p- 값은 실제 상관 관계가없는 경우 관찰 된 것보다 많은 상관 관계를 얻는 것입니다. 따라서 p가 매우 작 으면 샘플에 많은 상관 관계가 있음을 나타냅니다.
Rob Hyndman

이와 같은 p- 값은 잔차가 매우 자기 상관됨을 나타냅니다.
Dail

흠 이상한, 이미지를보십시오 : imageshack.us/f/59/17671620.png 올바른 이미지가 자동 상관되지 않는 방법은 무엇입니까?
Dail

: dail 왼쪽 이미지에 분산의 구조적 변화가있는 것으로 보입니다 (Ruey Tsay의 기사 "Outliers, Level Shifts and Variance Changes of Time Series", Journal of Forecasting, VOl 7, 1-20 (1988) 참조) 이 경우 전체 분포가 여전히 정상이라는 사실 때문에 DW를 혼동하지 않을 것입니다. 오른쪽 이미지에는 시각적으로 명백하고 경험적으로 식별 가능한 이상 현상 (펄스)이있어 비정규 적 (leptokurtotic wikopedia 참조 : 분포) 양의 과잉 첨도를 가진
렙 토쿠 르틱 (

11

DW 테스트 또는 선형 회귀 테스트는 데이터의 이상에 대해 강력하지 않습니다. 펄스, 계절 펄스, 레벨 시프트 또는 현지 시간 추세가있는 경우 이러한 처리되지 않은 구성 요소가 오류의 분산을 팽창시켜 테스트를 하향 편향시켜 (귀하가 알게 된대로) 귀무 가설을 부정확하게 수용하도록하기 때문에이 테스트는 쓸모가 없습니다. 자동 상관. 이 두 가지 테스트 나 내가 알고있는 다른 파라 메트릭 테스트를 사용하기 전에 잔차의 평균이 0.0과 통계적으로 크게 다르지 않다는 것을 "증명"해야합니다. 그렇지 않으면 기본 가정이 유효하지 않습니다. DW 테스트의 제약 조건 중 하나는 회귀 오류가 정규 분포를 따른다는 가정입니다. 다음과 같은 것들 중에서 정규 분포 된 평균에 주목하십시오.http://homepage.newschool.edu/~canjels/permdw12.pdf ). 또한 DW 테스트는 지연 1의 자동 상관 관계에 대해서만 테스트합니다. 데이터는 매주 / 계절 효과가있을 수 있으며 이는 진단되지 않고 처리되지 않으면 DW 테스트를 하향 편향시킵니다.


잔차가 0과 크게 다른지 테스트하기위한 테스트는 무엇입니까? 회귀에 절편이 포함되면 잔차 평균은 대수 0 이므로이 문제를 피할 수있는 방법이 궁금합니다.
mpiktas

: mpkitas 상수를 포함 할 때 오류의 평균은 0.0으로 보장되지만 오류의 평균이 모든 곳에서 0임을 보장하지는 않습니다. 예를 들어 계열의 평균에 변화가있는 경우 전체 평균은 일정하지만 각기 다른 평균을 갖는 잔차의 tw0 "클럼프"를 생성합니다. 자세한 내용은 Ruey Tsay의 기사 "Outliers, Level Shifts and Variance Changes in Time Series", Journal of Forecasting, VOl 7, 1-20 (1988)을 참조하십시오. 또는 faculty.chicagobooth.edu/ruey.tsay/teaching/uts/lec10-08.pdf 또는 Google "자동 개입 탐지"
IrishStat

1
이것은 모든 회귀 분석에 내재 된 표준 "생략 변수 없음"가정에 불과합니다.
찰리
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.