특정 유형의 ARIMA 설명 찾기


25

이 찾기 어려운 수 있지만, 내가 읽고 싶은 ARIMA 예를 잘 설명 하는 것이

  • 최소한의 수학을 사용

  • 특정 사례를 예측하기 위해 해당 모델을 사용하여 모델을 구축하는 것 이상의 토론

  • 그래픽과 수치 결과를 사용하여 예측 값과 실제 값 사이의 적합도를 특성화합니다.

답변:


7

ARIMA 모델링 소개에 대한 나의 제안 독서는

R McCleary에 의해 1980 년 사회 과학을위한 응용 시계열 분석 ; RA 헤이; EE Meidinger; D 맥도 월

이것은 수학적 요구가 너무 엄격하지 않도록 사회 과학자를 대상으로합니다. 또한 더 짧은 치료를 위해 두 개의 Sage Green Book을 제안합니다 (McCaryary 책과 완전히 중복되어 있음에도 불구하고).

Ostrom 텍스트는 ARMA 모델링 일 뿐이며 예측에 대해서는 다루지 않습니다. 나는 그들이 예측 오류 그래프에 대한 귀하의 요구 사항을 충족시킬 것이라고 생각하지 않습니다. 이 포럼에서 시계열 태그가 붙은 질문을 검토하여 더 유용한 자료를 찾을 수 있다고 확신합니다.


McCleary 책은 훌륭하게 쓰여졌 고 간결하며 정말 좋은 소개입니다. 마지막 장에는 Fortran과 같은 고급 언어에 대해 이야기하는 멋진 의도하지 않은 유머가 있습니다.
richiemorrisroe

31

나는 단순히“질문에 응답”하고 주제를 유지하기 위해 whuber의 부드러운 촉구에 응할 것입니다. 우리는“The Airline Series”라는 시리즈에 대해 144 개의 월간 측정치를 제공합니다. Box와 Jenkins는 역 로그 변환의 "폭발성"으로 인해 하이 사이드에 대한 예측을 제공 한 것으로 널리 비판을 받았습니다.여기에 이미지 설명을 입력하십시오

시각적으로 우리는 시리즈의 수준에 따라 원본 시리즈의 분산이 증가한다는 인상을 얻습니다. 그러나 유용한 모델의 요구 사항 중 하나는 "모델 오류"의 분산이 균질해야한다는 것입니다. 원본 계열의 분산에 대한 가정은 필요하지 않습니다. 모델이 단순히 상수 인 경우 동일합니다 (예 : y (t) = u). https://stats.stackexchange.com/users/2392/probabilityislogic이질성 / 이분산성 설명대한 조언에 대한 그의 답변에서 명확하게 언급 한 바와 같이 데이터 "가 아닌 정상"나는 항상 즐겁게 발견 한 것은 이것이다 "사람들이 걱정 약. 데이터를 정규적으로 배포 할 필요는 없지만 오류 용어는

시계열의 초기 작업은 종종 부적당 한 변환에 대한 결론으로 ​​잘못 이동했습니다. 여기서는이 데이터에 대한 교정 변환이 3 개의 특이한 데이터 포인트에 대한 조정을 반영하는 ARIMA 모델에 3 개의 표시기 더미 시리즈를 추가하는 것입니다. 다음은 지연 12 (.76) 및 지연 1 (.948)에서 강한 자기 상관을 제안하는 자기 상관 함수의 도표입니다. 자기 상관은 단순히 y의 지연에 의해 예측되는 종속 변수 인 모델의 회귀 계수입니다.

여기에 이미지 설명을 입력하십시오! 여기에 이미지 설명을 입력하십시오

위의 분석은 하나의 모델이 시리즈의 첫 번째 차이점을 제시하고 첫 번째 차이점과 동일한“잔여 시리즈”가 그 속성에 대해 연구 함을 제안합니다. 여기에 이미지 설명을 입력하십시오

이 분석은 두 개의 차분 연산자가 포함 된 모델로 수정하거나 모델링 할 수있는 강력한 계절 패턴이 데이터에 존재한다는 아이디어를 재확인합니다.

여기에 이미지 설명을 입력하십시오 여기에 이미지 설명을 입력하십시오

이 단순 이중 차분 법은 조정 된 계열 또는 일관되지 않은 분산을 증명하는 변형 된 계열을 느슨하게 말하면 잔차 세트를 생성하지만 불일치 분산의 이유는 잔차의 불변 평균입니다. 이중 차이 시리즈, 시리즈 마지막에 3 가지 이상이 있음을 시사합니다. 이 계열의 자기 상관은“모두가 양호하다”고 잘못 표시하고 Ma (1) 조정이 필요할 수 있습니다. 데이터에 이상이있을 수 있으므로 acf가 아래쪽으로 편향되어 있으므로주의해야합니다. 이것은 "이상한 나라의 앨리스 효과"로 알려져 있습니다. 즉, 구조 중 하나가 가정 중 하나를 위반하여 가려져있을 때 분명한 구조가 없다는 귀무 가설을 받아들입니다.

여기에 이미지 설명을 입력하십시오 여기에 이미지 설명을 입력하십시오

세 가지 특이한 점을 시각적으로 감지합니다 (117,135,136)

여기에 이미지 설명을 입력하십시오

특이 치를 탐지하는이 단계를 중재 탐지라고하며 다음 Tsay 작업에 따라 쉽게 프로그래밍하거나 쉽게 프로그래밍 할 수 없습니다.

여기에 이미지 설명을 입력하십시오여기에 이미지 설명을 입력하십시오

모델에 세 개의 지표를 추가하면 여기에 이미지 설명을 입력하십시오

그런 다음 추정 할 수 있습니다

여기에 이미지 설명을 입력하십시오

그리고 잔차와 acf의 도표를 받으십시오

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

이 acf는 모델에 잠재적으로 두 개의 이동 평균 계수를 추가 할 것을 제안합니다. 따라서 다음 추정 모델이 될 수 있습니다.

여기에 이미지 설명을 입력하십시오

굽힐 수 있는

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오 여기에 이미지 설명을 입력하십시오 여기에 이미지 설명을 입력하십시오 그런 다음 중요하지 않은 상수를 삭제하고 세련된 모델을 얻을 수 있습니다. 여기에 이미지 설명을 입력하십시오

일정한 분산의 잔차 세트를 얻기 위해 어떤 전력 변환도 필요하지 않았습니다. 예측은 폭발적이지 않습니다.

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

간단한 가중치 합계의 관점에서, 우리는 : 13 가중치; 0이 아닌 3 (1.0.1,0.,-1.0)

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

이 자료는 모델링 결정에있어 비 자동적이고 결과적으로 사용자 상호 작용이 필요한 방식으로 제시되었습니다.


안녕하세요 IrishStat, 또 나야. 나는 당신의 광범위한 예를 좋아했지만, 조금 모호한 두 구절이 있습니다 (적어도 나에게는). "및"이 acf는 모델에 잠재적으로 두 개의 이동 평균 계수를 추가 할 것을 제안합니다. " ACF 도표에서 정확히 무엇을 믿습니까? 둘 다 괜찮아 보이지 않습니까 (거의 모든 값이 "파란색 선"내에 있음)?
Bruder

: VBruder 필자는 "....."라는 문장으로 "잘못되었다"고 생각한다. 두 번째 예에서 lag1과 lag 12에 "bad acf"가 있다는 증거가 t2o ma 계수에 대한 잠재적 필요성을 시사한다 . acf91)과 acf (12)가 "위험하게 가까이"있기 때문에 이러한 한계를 지나치게 믿습니다. 내 정보에서 사용 가능한 게시 된 전자 메일 주소로 직접 연락 할 수 있습니다.
IrishStat

좋은 글씨. "세 개의 특이한 데이터 포인트에 대한 조정을 반영하는 ARIMA 모델"이 세 포인트에 대해 3 개의 더미 변수를 추가한다고 가정하십니까? 평신도의 관점에서,이 세 가지 특이 치는 미래 예측에서 어떻게 설명됩니까? (단순하다고 확신합니다. 익숙하지 않습니다.) 또한 시간이 지남에 따라 오류 범위가 커지지 않는 것처럼 보입니다. (또는 오류 한계는 단계의 양식에 따라 다릅니 까?) 미리 감사드립니다.
Adam

@Adam 미래의 값이 모두 0이기 때문에 3 개의 더미 변수가 예측에 아무런 역할을하지 않습니다. 예 제시된 오류 범위가 올바르지 않습니다. 우리는 결함을 해결했으며 이제 AUTOBOX는 시간이 지남에 따라 증가하는 오류 범위를 제시합니다. 저는 AUTOBOX 개발자 중 한 명입니다. .
IrishStat

@IrishStat "미래의 값이 모두 0이므로 세 개의 더미 변수가 예측에 아무런 역할을하지 않습니다."이것은 본질적으로 데이터에서 추출 된 것을 의미합니까? 예측 한계에 영향을 주어야합니까?
Adam

15

나는 1998 년 교과서 7 장에서 Makridakis & Wheelwright와 함께 그렇게하려고 노력했다 . 성공했는지 여부를 판단하기 위해 다른 사람들을 남겨 두겠습니다. 아마존 을 통해 온라인 으로이 장의 일부를 읽을 수 있습니다 (p311에서). 책에서 "ARIMA"를 검색하여 관련 페이지를 표시하도록 Amazon을 설득하십시오.

업데이트 : 무료 및 온라인으로 새 책이 있습니다. ARIMA 장에서는 여기에있다 .


3

Alan Pankratz의 일 변량 상자 -Jenkins 모델 : 개념 및 사례사용한 예측을 권장 합니다. 이 고전 서적에는 요청한 모든 기능이 있습니다.

  • 최소한의 수학을 사용
  • 특정 사례를 예측하기 위해 해당 모델을 사용하여 모델을 구축하는 것 이상의 토론
  • 그래픽과 수치 결과를 사용하여 예측 값과 실제 값 사이의 적합도를 특성화합니다.

유일한 단점은 1983 년에 인쇄되었으며 최근 개발이 없을 수 있다는 것입니다. 게시자는 2014 년 1 월 2 차 버전을 업데이트 할 예정입니다.


Alan Pankratz의 다른 저서 : Dynamic Regression Models을 사용한 예측도 추천합니다. 매우 유사한 재료이지만 조금 더 접지합니다. Box-Jenkins 측면에서는 덜 자세하지만. 2014 년 1 월에 제 2 판이 나올 것입니다.
Graeme Walsh

-4

ARIMA 모델은 단순히 가중 평균입니다. 이중 질문에 답합니다.

  1. 가중 평균을 계산하는 데 얼마나 많은 기간 (k)을 사용해야합니까

  1. 정확하게 k 가중치는 무엇입니까

그것은 일련의 계획을 세우기 위해 이전 값 (및 이전 값 ALONE)을 조정하는 방법을 결정하기 위해 처녀의기도에 응답한다.


-1이 회신은 "잘 설명 된 ... * example *"를 찾는 질문에 응답하지 않는 것 같습니다.
whuber

@whuber : OP는 "최소 수학 사용"에 대한 답변을 요청했습니다. 내 대답은 최소한의 수학을 자세히 설명했으며 ARIMA 모델을 일상적인 단어로 설명하도록 동기를 부여했습니다. 수학 이론 자들이 다항식, 미분 연산자, 비선형 최적화 등을 사용하여 "고급 설명"에 초점을 맞추기 때문에 이것은 결코 이루어지지 않습니다.
IrishStat

@ 아일랜드어 나는 특히 사용자가 요청할 때 수학을 유지하려는 동기에 동의합니다. 그러나이 답변은 "ARIMA 란 무엇인가"라는 다른 질문에 대답하는 것 같습니다. 원래 질문의 구체적인 특성은 OP가 ARIMA가 무엇이며 무엇이 좋은지 잘 알고 있음을 나타냅니다. 그들은 그것을 실제로보고 싶어합니다 . 나는 당신이 그러한 사례 연구를 쉽게 기여할 수 있다고 확신합니다 :-).
whuber

: whuber : 그것은 내가하기 매우 쉬웠을 것입니다.
IrishStat

@ 아일랜드 나는 그것을 기대하고 있습니다. 또한,이 문제는 여기에 오지 않았지만 다른 곳에서도 나타났습니다. 이러한 기여는 잠재적으로 더 강력하고 더 높이 평가되어 사람들이 더 많은 명백한 형태의 마케팅보다 사람들이 할 수있는 일을 알려주는 방법입니다.
우버
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.