ARIMA 모델의 관측치 48에서 혁신적인 특이 치를 어떻게 통합합니까?


10

데이터 세트를 작업 중입니다. 일부 모델 식별 기술을 사용한 후 ARIMA (0,2,1) 모델을 만들었습니다.

R detectIO의 패키지 TSA에 있는 함수를 사용하여 48 번째 원본 데이터 세트에서 혁신적인 이상치 (IO) 를 감지했습니다 .

이 특이 치를 내 모델에 어떻게 통합하여 예측 목적으로 사용할 수 있습니까? R에서 예측할 수 없기 때문에 ARIMAX 모델을 사용하고 싶지 않습니다. 다른 방법이 있습니까?

순서대로 내 값은 다음과 같습니다.

VALUE <- scan()
  4.6  4.5  4.4  4.5  4.4  4.6  4.7  4.6  4.7  4.7  4.7  5.0  5.0  4.9  5.1  5.0  5.4
  5.6  5.8  6.1  6.1  6.5  6.8  7.3  7.8  8.3  8.7  9.0  9.4  9.5  9.5  9.6  9.8 10.0
  9.9  9.9  9.8  9.8  9.9  9.9  9.6  9.4  9.5  9.5  9.5  9.5  9.8  9.3  9.1  9.0  8.9
  9.0  9.0  9.1  9.0  9.0  9.0  8.9  8.6  8.5  8.3  8.3  8.2  8.1  8.2  8.2  8.2  8.1
  7.8  7.9  7.8  7.8

그것은 실제로 내 데이터입니다. 그들은 6 년 동안의 실업률입니다. 그러면 72 개의 관측치가 있습니다. 각 값은 소수점 이하 1 자리까지입니다


6
다른 모든 기간에서 대해 1 이고 0 인 더미를 만들 수 있습니다 . 그런 다음 모델을 다시 추정하십시오. 그러면이 특이 치가 예측을 왜곡하지 못하게됩니다. 이것이 마음에 들지 않으면 두 번째 단락을 자세히 설명해야합니다. =48
Dimitriy V. Masterov 2016

2
@Gen_b 당신은 맞습니다. 아마 취소 MA (1)를 산출하는 차이가 너무 많기 때문에 당신을 방해해야합니다. 부적절한 도구를 사용하면 잘못된 결과가 나타납니다.
IrishStat

2
두 번째 차이점에서는 특이 치처럼 보이지만 원래 시리즈의 관측치 47에서 약간의 추가 점프로 인한 것 같습니다. 두 번 차이가 나면 1주기 후에 큰 부정적 특이 치처럼 보입니다. 관측 47에서 작은 효과를 제거하기 위해 간단한 작업을 수행하면 (거의 모든 것이 합리적 임) 두 번째 차이에 특이 치가 나타나지 않습니다. 나는 그것이 원래 규모의 AO로 더 잘 보일 것이라고 말하고 싶습니다.
Glen_b-복지 주 모니카

2
이 데이터 세트에는 많은 일이 있지만 로컬 시간적 행동 (상관 관계, 계절성 등)이 가장 적습니다. 이와 같은 데이터를 일련의 숫자로 맹목적으로 분석하면 어리석은 결과가 발생할 위험이 있습니다. 이 데이터의 의미 에 대해 무엇을 알려줄 수 있습니까? 그들은 아마도 모니터링 스테이션에서 무언가의 측정입니까? 경제적 인 시계열? 생물학적 성장 차트? 근본적인 현상에 대해 이해하면 통계 소프트웨어로 처리 할 수있는 것보다 모델을 식별하는 데 도움이됩니다.
whuber

2
@ whuber : 6 년 동안의 실업률입니다!
b2amen

답변:


3

경우 다음 Y * ( t ) = [ θ / φ ] [ ( t ) ] + [ θ / φ ] [ IO ( t ) ] .와이()=[θ/ϕ][()+IO()]와이*()=[θ/ϕ][()]+[θ/ϕ][IO()]

θ=1ϕ=[1.5]
와이*()=[1/(1.5)][()]
+IO().5IO(1)+.25IO(2).125IO().


와이()=[1/(1.5)][()] +10IO()5IO(1)+2.5IO(2)1.25IO().
IO

이런 식으로 변칙의 영향이 순간적 일뿐만 아니라 기억력을 가지고 있음을 알 수 있습니다.

[()/()][()]

메모리를 통합 할 때마다 차이 연산자 또는 ARMA 구조의 결과이기 때문에 인과 적 시리즈가 생략되어 무지에 대한 암묵적인 승인입니다. 이는 펄스 / 레벨 시프트, 계절 펄스 또는 로컬 시간 추세와 같은 중재 결정 론적 시리즈를 통합해야 할 필요도 있습니다. 이러한 더미 변수는 결정적인 사용자 지정 원인 변수를 생략하기 위해 필요한 프록시입니다. 종종 당신이 가진 모든 것은 일련의 관심사이며 내가 언급 한 한정자를 감안할 때 분석되는 데이터의 본질을 완전히 무시한 과거를 기반으로 미래를 예측할 수 있습니다. 유일한 문제는 당신이 앞길을 예측하기 위해 뒷 창문을 사용하는 것입니다 .... 실제로 위험한 일입니다.

데이터가 게시 된 후 ...

합리적인 모델은 (1,1,0)이고 여기에 이미지 설명을 입력하십시오AO 이상은 39,41,47,21 및 69 기간 (48 기간이 아닌)에서 확인되었습니다. 이 모델의 잔차는 분명한 구조가없는 것으로 보입니다. 여기에 이미지 설명을 입력하십시오AND 여기에 이미지 설명을 입력하십시오Fice AO는 시계열 히스토리에없는 활동에 의해 반영된 활동의 최적 표현을 중요하게 생각합니다. OP의 과도 차이가있는 모델의 ACF가 모델의 부적합을 반영한다고 생각합니다. 모델은 다음과 같습니다. 여기에 이미지 설명을 입력하십시오 문제 또는 기회가 모델 식별 / 수정 / 검증의 영역에 있으므로 R 코드는 제공되지 않습니다. 마지막으로 실제 / 적합 및 예측 된 계열의 도표.! [여기에 이미지 설명 입력] [6]


1
답장을 보내 주셔서 감사합니다; 하지만 실제로 내 모델 대신 R 코드를 원했습니다.
b2amen

1
@ b2amen 네,하지만 저는 글렌 _b가 "물건"을 원했고 그에게 응답 할 것이라고 생각했습니다.
IrishStat

편집 해 주셔서 감사합니다. 당신과 나는 좋은 파트너를 만들 것입니다!
IrishStat

@ IrishStat : 내 데이터는 원래 질문에 포함되어 있습니다. 그것이 당신을 도와 줄 수 있기를 바랍니다. 어쨌든 감사합니다
b2amen

@IrishStat : 나는 당신의 출력을 좋아한다. 꽤 깔끔해 보입니다. 그리고 어떤 소프트웨어를 사용하셨습니까? 그러나 AR (2,1,0)을 어떻게 식별했는지 설명 할 수 있습니까? 감사합니다
b2amen
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.