ACF 및 PACF 검사를 통한 ARMA 계수 추정


16

ACF 및 PACF 플롯을 육안으로 검사하여 시계열에 대한 적절한 예측 모델을 어떻게 추정합니까? 어느 것이 (즉, ACF 또는 PACF) AR 또는 MA에게 말합니까 (또는 둘 다)? 그래프의 어느 부분이 계절 ARIMA의 계절 및 비 계절 부분을 알려줍니까?

아래 표시된 ACF 및 PCF 기능을 고려하십시오. 그것들은 두 개의 차이가있는 로그 변환 된 시리즈에서 온 것입니다. 하나의 간단한 차이와 계절적인 것 ( 원래 데이터 , 로그 변환 된 데이터 ). 시리즈의 특징은 무엇입니까? 어떤 모델이 가장 적합합니까?

여기에 이미지 설명을 입력하십시오

답변:


12

내 대답은 실제로 javlacelle의 요약이지만 간단한 의견으로는 너무 길지만 너무 짧아 쓸모가 없습니다.

jvlacelle의 응답은 한 수준에서 기술적으로 정확하지만 일반적으로 결코 사실이 아닌 특정 "사물"을 구축하기 때문에 "과도하게 단순화"됩니다. 하나 이상의 타임 트렌드 또는 하나 이상의 레벨 시프트 또는 하나 이상의 계절 펄스 또는 하나 이상의 일회 펄스와 같은 결정 론적 구조가 필요하지 않다고 가정한다. 또한 식별 된 모델의 매개 변수는 시간에 따라 변하지 않으며 잠정적으로 식별 된 모델의 기본 오류 프로세스도 시간에 따라 변하지 않는다고 가정합니다. 위의 내용 중 하나를 무시하는 것은 종종 (항상 내 의견으로는!) 재난의 조리법 또는 더 정확하게는 "잘못 식별 된 모델"입니다. 이에 대한 전형적인 사례는 항공사 시리즈와 수정 된 질문에 OP가 제시하는 시리즈에 대해 제안 된 불필요한 로그 변환입니다. 처리되지 않은 198,207,218,219 및 256 기간에 "비정상적인"값이 몇 개만 있기 때문에 데이터에 대한 로그 변환이 필요하지 않습니다. 처리되지 않은 상태로두면 더 높은 수준의 오류 분산이 있다는 잘못된 인상을받습니다. "비정상적인 값"은 종종 사람의 눈을 피하는 필요한 ARIMA 구조를 고려하여 식별됩니다. 관측 된 Y의 분산이 시간이 지남에 따라 일정하지 않은 경우가 아니라 시간에 따라 오차 분산이 일정하지 않은 경우 변환이 필요합니다. . 원시적 절차는 전술 한 임의의 해결책에 앞서 변환을 조기에 선택하는 전술적 오류를 여전히 만든다. 단순한 ARIMA 모델 식별 전략은 60 년대 초반에 개발되었지만 그 이후로 많은 개발 / 개선이 진행되었다는 것을 기억해야합니다. 처리되지 않은 219 및 256은 수준이 높을수록 오류 분산이 높다는 잘못된 인상을줍니다. "비정상적인 값"은 종종 사람의 눈을 피하는 필요한 ARIMA 구조를 고려하여 식별됩니다. 관측 된 Y의 분산이 시간이 지남에 따라 일정하지 않은 경우가 아니라 시간에 따라 오차 분산이 일정하지 않은 경우 변환이 필요합니다. . 원시적 절차는 전술 한 임의의 해결책에 앞서 변환을 조기에 선택하는 전술적 오류를 여전히 만든다. 단순한 ARIMA 모델 식별 전략은 60 년대 초반에 개발되었지만 그 이후로 많은 개발 / 개선이 진행되었다는 것을 기억해야합니다. 처리되지 않은 219 및 256은 수준이 높을수록 오류 분산이 높다는 잘못된 인상을줍니다. "비정상적인 값"은 종종 사람의 눈을 피하는 필요한 ARIMA 구조를 고려하여 식별됩니다. 관측 된 Y의 분산이 시간이 지남에 따라 일정하지 않은 경우가 아니라 시간에 따라 오차 분산이 일정하지 않은 경우 변환이 필요합니다. . 원시적 절차는 전술 한 임의의 해결책에 앞서 변환을 조기에 선택하는 전술적 오류를 여전히 만든다. 단순한 ARIMA 모델 식별 전략은 60 년대 초반에 개발되었지만 그 이후로 많은 개발 / 개선이 진행되었다는 것을 기억해야합니다. 관측 된 Y의 분산이 시간에 따라 일정하지 않은 경우가 아니라 시간에 따라 오차 분산이 일정하지 않은 경우 변환은 필요한 ARIMA 구조를 고려하여 식별됩니다. 원시적 절차는 전술 한 임의의 해결책에 앞서 변환을 조기에 선택하는 전술적 오류를 여전히 만든다. 단순한 ARIMA 모델 식별 전략은 60 년대 초반에 개발되었지만 그 이후로 많은 개발 / 개선이 진행되었다는 것을 기억해야합니다. 관측 된 Y의 분산이 시간에 따라 일정하지 않은 경우가 아니라 시간에 따라 오차 분산이 일정하지 않은 경우 변환은 필요한 ARIMA 구조를 고려하여 식별됩니다. 원시적 절차는 전술 한 임의의 해결책에 앞서 변환을 조기에 선택하는 전술적 오류를 여전히 만든다. 단순한 ARIMA 모델 식별 전략은 60 년대 초반에 개발되었지만 그 이후로 많은 개발 / 개선이 진행되었다는 것을 기억해야합니다. 원시적 절차는 전술 한 임의의 해결책에 앞서 변환을 조기에 선택하는 전술적 오류를 여전히 만든다. 단순한 ARIMA 모델 식별 전략은 60 년대 초반에 개발되었지만 그 이후로 많은 개발 / 개선이 진행되었다는 것을 기억해야합니다. 원시적 절차는 전술 한 임의의 해결책에 앞서 변환을 조기에 선택하는 전술적 오류를 여전히 만든다. 단순한 ARIMA 모델 식별 전략은 60 년대 초반에 개발되었지만 그 이후로 많은 개발 / 개선이 진행되었다는 것을 기억해야합니다.

데이터가 게시 된 후 편집 :

http://www.autobox.com/cms/ 를 사용하여 합리적인 모델을 식별했습니다. http://www.autobox.com/cms/ 는 제가 개발하는 데 도움이되는 앞서 언급 한 아이디어를 통합 한 소프트웨어입니다. 여기에 이미지 설명을 입력하십시오모수 불변성에 대한 차우 테스트는 데이터가 분할되고 모델 매개 변수로 마지막 94 개의 관측치가 시간이 지남에 따라 변경되었음을 제안했습니다. 여기에 이미지 설명을 입력하십시오이 마지막 94 개의 값은 여기에 이미지 설명을 입력하십시오모든 계수가 유의 한 방정식 을 산출했습니다 . 여기에 이미지 설명을 입력하십시오. 잔차 그림은 여기에 이미지 설명을 입력하십시오다음 ACF에서 임의성을 제안하는 합리적인 산포 를 나타 여기에 이미지 설명을 입력하십시오냅니다. 미묘하지만 중요한 특이 치를 보여주는 실제 및 정리 된 그래프가 밝게 표시됩니다. 여기에 이미지 설명을 입력하십시오. 마지막으로 실제, 적합 및 예측의 도표는 우리의 작업을 모두 기록하지 않고 요약합니다.여기에 이미지 설명을 입력하십시오. 전원 변환은 마약과 같다는 점은 잘 알려져 있지만 종종 잊혀집니다. 마지막으로 모델에는 AR (1) 구조가 아닌 AR (2) BUT이 있습니다.


왜 우리는 로그 변환을 할 수 없습니까? 다중 계절성이있는 R의 AirPassengers 데이터 세트를 참조하십시오. 또한 로그를 취하지 않으면 데이터 집합의 분산이 증가합니다. 즉, 고정되지 않습니다. 로그 변환을 수행하지 않고 이러한 데이터 세트를 어떻게 처리 할 수 ​​있습니까? 설명해 주시겠습니까?
user2338823

"처리되지 않은 기간에"비정상적인 "값이 몇 개 밖에 없기 때문에 데이터에 대한 로그 변환이 필요하지 않습니다. 분산의 불변성에 대한 정상 성 가정은 원본 계열의 분산이 아닌 오차 분산에 관한 것입니다. R 소프트웨어는 자동으로 이상을 식별하고 통합 할 수 없습니다. 시리즈에 대한 autobox.com/cms/index.php/blog 토론을 참조하십시오 . AND autobox.com/pdfs/vegas_ibf_09a.pdf
IrishStat

전력 변환에 대한 Box-Cox 테스트는 특이 치를 가정하지 않으므로 변경 분산을 예상 값과 잘못 / 실수로 연결하여 변환의 필요성을 잘못 제안 할 수 있습니다. 처리되지 않은 잠재 결정적 구조 처리에 대한 소개로 Box의 학생 중 한 으로부터 Tsay의 기사 docplayer.net/… 을 참조하십시오. Tsay가 지적한대로 전력 변환 또는 GLS를 통해 분산 변화.
IrishStat

14

개념을 정리하기 위해 ACF 또는 PACF를 육안으로 검사하여 임시 ARMA 모델을 선택할 수 있습니다 (추정 아님). 모델을 선택하면 가능성 함수를 최대화하고 제곱합을 최소화하거나 AR 모델의 경우 모멘트 방법을 사용하여 모델을 추정 할 수 있습니다.

ACF 및 PACF를 검사 할 때 ARMA 모델을 선택할 수 있습니다. 이 접근법은 다음 사실에 의존한다. 1) p 차의 고정 AR 프로세스의 ACF는 지수 속도로 0이되고, 지연 p 이후 PACF는 0이된다. 2) 차수 q의 MA 프로세스의 경우 이론적 ACF 및 PACF는 역 동작을 나타냅니다 (지연 q 후에 ACF가 잘리고 PACF는 비교적 빠르게 0이 됨).

일반적으로 AR 또는 MA 모델의 순서를 감지하는 것이 분명합니다. 그러나 AR 및 MA 부분을 모두 포함하는 프로세스에서는 ACF 및 PACF가 모두 0으로 감소하므로 잘린 지연이 흐리게 표시 될 수 있습니다.

진행하는 한 가지 방법은 우선 순위가 낮은 AR 또는 MA 모델 (ACF 및 PACF에서 더 명확 해 보이는 모델)을 맞추는 것입니다. 그런 다음 추가 구조가있는 경우 잔차에 표시되므로 잔차의 ACF 및 PACF를 검사하여 추가 AR 또는 MA 항이 필요한지 확인합니다.

일반적으로 둘 이상의 모델을 시도하고 진단해야합니다. AIC를보고 비교할 수도 있습니다.

처음 게시 한 ACF 및 PACF는 ARMA (2,0,0) (0,0,1), 즉 일반 AR (2) 및 계절 MA (1)를 제안했습니다. 모델의 계절 부분은 정규 부분과 유사하게 결정되지만 계절 순서의 지연을보고 있습니다 (예 : 월별 데이터의 12, 24, 36, ...). R을 사용하는 경우 표시되는 기본 지연 수를 늘리는 것이 좋습니다 acf(x, lag.max = 60).

표시 한 플롯은 의심스러운 음의 상관 관계를 나타냅니다. 이 플롯이 이전 플롯과 동일한 것을 기반으로하는 경우 너무 많은 차이가있을 수 있습니다. 이 게시물 도 참조하십시오 .

여기, 다른 소스들, 추가 정보를 얻을 수있다 : 제 3 장에서 시계열 : 이론과 방법을 피터 J. Brockwell 리처드 A. 데이비스에 의해 여기 .


네가 옳아. 한 가지 차이점이 너무 많을 수 있습니다. 그래도 의심의 여지가 있습니다. 로그 데이터 에서 간단한 차이 ( i.imgur.com/1MjLzlX.png )와 계절 (12) 하나 ( i.imgur.com/E64Sd7p.png )를 모두 수행했습니다. 계절에 따라 어느 것을보아야합니까?
4everlearning

1
@ 4everlearning ACF와 PACF는 계절적 차이를 본 후 고정 프로세스에 대해 기대할 수있는 것에 더 가깝게 보입니다. ARIMA (2,0,0) (0,1,1)을 R에 피팅 arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1)))하고 잔차의 ACF 및 PACF를 표시하여 시작할 수 있습니다 . 분석에 관심을 가져야하는 IrishStat에서 제기 한 추가 문제도 알고 있어야합니다.
javlacalle

감사. AR 및 MA 주문을 찾으려면 어떻게해야합니까? 또한 Akaike Information Criterion은 내 모델에 대해 음수 값을 산출합니다. AIC = -797.74 및 AIC = -800.00과 같이 다른 모델과 비교하는 방법을 잘 모르겠지만 이것이 중요하지 않다는 것을 알고 있습니다. 어느 것이 바람직합니까?
4everlearning

위의 답변에 주어진 아이디어에 따라 주문을 결정할 수 있습니다. ACF가 비교적 빨리 0으로 가고 지연 2 후에 PACF가 잘 리면 AR (2) 구조가 데이터에있을 수 있습니다. 반대 생각은 MA 감지에 적용됩니다. 일반적인 권장 사항으로, 낮은 차수의 모델로 시작하여 초기 모델에 추가 할 AR 또는 MA 구조를 찾는 잔차를 검사하십시오.
javlacalle

일반적으로 AIC가 낮을수록 모델의 품질이 향상됩니다 (두 모델에서 동일한 척도로 데이터를 사용한다고 가정 할 때, 즉 시리즈는 비교중인 모든 모델의 레벨 또는 로그 여야 함) ).
javlacalle
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.