Augmented Dickey Fuller 테스트와 혼동


16

electricityR 패키지에서 사용할 수 있는 데이터 세트를 작업 중입니다 TSA. 저의 목표는 arima모델이이 데이터에 적합한 지 알아 내고 결국에는 맞는지 알아내는 것입니다. 그래서 나는 다음과 같이 진행했습니다 :

1 : 다음 그래프의 결과 인 시계열을 플로팅하십시오 : ts plot1

2 : electricity분산을 안정화 하기 위해 로그를 만들고 싶었 습니다. adf(Augmented Dickey Fuller) 테스트를 사용한 원본 데이터 세트 와 놀랍게도 결과는 다음과 같습니다.

코드 및 결과 :

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

글쎄, 초보자의 시계열 개념에 따르면 데이터가 고정적이라는 것을 의미한다고 가정합니다 (작은 p- 값, 비정상 성이 아닌 귀무 가설을 기각 함). 그러나 ts 플롯을 보면 이것이 고정 될 수있는 방법을 찾지 못합니다. 누구든지 이것에 대한 유효한 설명이 있습니까?


5
ADF는 단위 루트 정지에 대해서만 테스트합니다. 이는 추세 고정 일 수 있습니다. 따라서 KPSS 테스트를 사용해야합니다. stats.stackexchange.com/questions/30569/…를 참조하십시오 . 일반적으로 DS (차이 정지) 모델과 TS (추세 정지) 모델간에 차이가 있습니다. KPSS는 이러한 모델을 구별하기위한 더 나은 테스트입니다. 자세한 내용은 링크를 참조하십시오.
통계 학자 Tistician

3
시리즈에 계절과 트렌드가있는 것 같습니다. ADF 테스트에 결정적 추세 + 계절 인형을 통합하고 테스트를 실행하십시오. 자동 상관 잔차도 확인하십시오.
Pantera 2016 년

답변:


12

adf.test엑스엑스1

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary

2

"adf.test"가 실제로 "tseries"패키지 (직접 또는 간접)에서 온 것으로 가정하면, 그 이유는 선형 시간 추세를 자동으로 포함하기 때문입니다. tseries doc (버전 0.10-35)에서 : "상수와 선형 추세를 포함하는 일반적인 회귀 방정식이 사용됩니다 ...] 테스트 결과는 실제로 추세 정상 성을 나타냅니다 (이름에도 불구하고 고정되어 있지 않음).

또한 Pantera에 따르면 계절 효과로 인해 결과가 왜곡 될 수 있습니다. 실제로이 시리즈는 시간 추세 + 결정적 계절 + 확률 론적 근근 과정 일 수 있지만 ADF 테스트는 계절 변동을 결정 론적 경향으로의 확률 론적 복귀로 잘못 해석 할 수 있으며, 이는 근본보다 작은 근본을 의미합니다. 반면에, 지연 시간이 충분하면 ADF 테스트에서 보는 0 / 장기 주파수가 아닌 계절 주파수에서 (스퓨리어스) 단위 루트로 표시되어야합니다. 계절 패턴 계절을 포함하는 것이 좋습니다.)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.