프로세스가 자체의 이전 값에 의존하는 경우 AR 프로세스라는 것을 이해합니다. 이전 오류에 의존하는 경우 MA 프로세스입니다.
이 두 상황 중 하나가 언제 발생합니까? 프로세스를 MA와 AR로 가장 잘 모델링하는 것이 무엇을 의미하는지에 대한 근본적인 문제를 조명하는 확실한 예가 있습니까?
프로세스가 자체의 이전 값에 의존하는 경우 AR 프로세스라는 것을 이해합니다. 이전 오류에 의존하는 경우 MA 프로세스입니다.
이 두 상황 중 하나가 언제 발생합니까? 프로세스를 MA와 AR로 가장 잘 모델링하는 것이 무엇을 의미하는지에 대한 근본적인 문제를 조명하는 확실한 예가 있습니까?
답변:
중요하고 유용한 결과 중 하나는 Wold 표현 정리 (때로는 Wold 분해라고 함)인데, 이는 모든 공분산-정지 시계열 를 두 개의 시계열, 하나의 결정론 및 확률론의 합으로 작성할 수 있다고 말합니다 .
, 여기서 는 결정적입니다.
두 번째 용어는 무한 MA입니다.
(무제한 MA를 무한 AR 프로세스로 작성할 수있는 경우도 있습니다.)
이것은 계열이 공분산-고정 적이고 결정 론적 부분을 식별 할 수 있다고 가정하면 확률 론적 부분을 항상 MA 프로세스로 작성할 수 있음을 나타냅니다. 마찬가지로 MA가 가역성 조건을 만족하는 경우 항상 AR 프로세스로 작성할 수 있습니다.
한 양식으로 작성된 프로세스가있는 경우 종종 다른 양식으로 변환 할 수 있습니다.
따라서 어떤 의미에서 공분산 고정 계열의 경우 종종 AR 또는 MA가 적합합니다.
물론 실제로는 큰 모델이 없습니다. 유한 AR 또는 MA가있는 경우 ACF 및 PACF는 결국 기하학적으로 붕괴됩니다 (두 함수 중 하나의 절대 값이 아래에있는 기하학적 함수가 있음). 이는 AR 또는 다른 형태의 MA는 종종 합리적으로 짧을 수 있습니다.
따라서 공분산 정지 조건 하에서 결정 론적 및 확률 론적 구성 요소를 식별 할 수 있다고 가정하면 AR과 MA가 모두 적절할 수 있습니다.
Box 및 Jenkins 방법론은 매개 변수가 거의없는 AR, MA 또는 ARMA 모델 인 모순적인 모델을 찾습니다. 일반적으로 ACF와 PACF는 모델을 식별하기 위해 사용됩니다. 잔차 계열이 화이트 노이즈와 합리적으로 나타날 때까지 잔차 구조 (일반적으로 잔차에서 ACF 및 PACF를 통해). 종종 일련의 근사값을 제공 할 수있는 여러 모델이 있습니다. 실제로 다른 기준이 종종 고려됩니다.
이 접근법에 대한 비판에는 몇 가지 근거가 있습니다. 예를 들어, 이러한 반복 프로세스로 인한 p- 값은 일반적으로 (데이터를보고) 모델이 도착한 방식을 고려하지 않습니다. 예를 들어, 샘플 분할을 통해이 문제를 적어도 부분적으로 방지 할 수 있습니다. 두 번째 비판의 예는 실제로 정지 시리즈를 얻는 것이 어렵다는 점입니다. 많은 경우에 정상과 합리적으로 일치하는 시리즈를 얻기 위해 변형 할 수 있지만, 실제로는 그렇지 않습니다 (유사한 문제는 일반적입니다) 통계 모델에 문제가있을 수 있지만 때로는 여기에서 더 문제가 될 수 있습니다).
[억세스 라우터와 해당 무한 MA 간의 관계는 Hyndman 및 Athanasopoulos '에서 설명한 예측 : 원리 및 연습 , 여기 ]
나는 질문의 첫 번째 부분에 대한 매력적인 답변이라고 생각하는 것을 제공 할 수 있지만 ( "MA?"?) 현재 질문의 두 번째 부분에 대해 동일한 매력적인 답변을 생각하고 있습니다 ( "AR ??").
연속 일에 주식의 종가 (스플릿 및 배당으로 조정)로 구성된 시리즈를 고려하십시오. 매일 마감 가격은 추세 (예 : 선형)와 전날의 일일 충격에 대한 가중 효과에 더해집니다. 아마도 t-1 일차 충격의 영향은 t-2 일차 충격보다 t 일차 가격에 더 큰 영향을 미칠 것으로 예상됩니다. 따라서 논리적으로, t 차일의 종가는 추세를 반영합니다. t 일째 값에 t-1 일까지의 충격에 대한 가중 합계의 상수 (1 미만)에 1을 곱한 값 (예 : t-1 일의 오류 항) (MA1)에 상수 (1 미만)를 더한 값 t-2 일까지의 충격의 가중 합계 (즉, t-2 일의 오차 항) (MA2)를 곱한 다음 t의 새로운 충격 (화이트 노이즈). 이러한 종류의 모델은 주식 시장과 같은 시리즈를 모델링하는 데 적합 해 보입니다. 여기서 t 일의 오류 항은 이전 및 현재 충격의 가중 합계를 나타내며 MA 프로세스를 정의합니다. 전적으로 AR 프로세스에 대해 똑같이 설득력있는 이론을 연구하고 있습니다.
이것은 AR, MA 및 ARMA 프로세스를 시각화하는 데 도움이되는 가장 간단한 예입니다.
이것은 주제에 대한 소개를위한 시각적 인 도움 일 뿐이며 모든 가능한 경우를 설명 할만큼 엄격하지는 않습니다.
다음을 가정 해 봅시다 : 우리는 경쟁에서 특정 종류의 행동을 수행하는 임무를 가진 두 명의 요원이 있습니다 (오른쪽으로 수평으로 점프).
"인간"은 평균적으로 물리적 능력에 따라 점프 할 때마다 "deviation"의 표준 편차로 "μ"의 거리를 커버 할 것으로 예상됩니다. 그러나, 인간은 특히 정신력이 부족합니다. :) 그의 성과는 또한 이전 점프가 지연되거나 / 미치거나 / 그의 기대를 초과했는지 여부에 달려 있습니다.
"기계"는 단 하나의 차이점만으로 위의 인간과 정확히 동일한 사양으로 설계되었습니다. 기계는 감정이 없으며 과거의 성능에 영향을받지 않습니다.
또한 두 에이전트가 두 개의 점프를 포함하는 각 게임과 함께 두 개의 게임을 수행해야합니다.
"Final Jump"는 워밍업 점프 후 최종 점프에서 커버 된 거리를 기준으로 득점했으며, 그 결과는 경쟁에서 무시되었지만 인간이 관찰 할 수 있습니다. 워밍업 점프가 시작되는 곳에서 마지막 점프가 시작됩니다.
"Combined Jump"는 최초 및 최종 점프에서 포함 된 결합 거리를 기준으로 득점했습니다. 최종 점프는 초기 점프가 시작되는 곳에서 시작됩니다.
아래 차트는 위의 배우 및 게임과 관련된 네 가지 시나리오 각각을 가장 잘 설명하는 모델을 보여줍니다.
따라서 일 변량 시계열을 가지고 있으며 모델링 / 예측하고 싶습니까? ARIMA 유형 모델을 사용하도록 선택했습니다.
의 매개 변수는 데이터 세트에 가장 적합한 것에 따라 다릅니다. 그러나 어떻게 알 수 있습니까? 최근의 접근 방식은 Hyndman & Khandakar (2008)의 "자동 시계열 예측"입니다 ( pdf ).
이 알고리즘은 다른 버전의 p, q, P 및 Q를 시도하고 AIC, AICc 또는 BIC가 가장 작은 것을 선택합니다. 그것은 예측 R 패키지 의 auto.arima () 함수에서 구현 됩니다 . 정보 기준의 선택은 함수에 전달할 매개 변수에 따라 다릅니다.
선형 모델의 경우 가장 작은 AIC를 가진 모델을 선택하면 일대일 교차 검증이 가능합니다.
또한 최소 4 년 동안 충분한 데이터가 있는지 확인해야합니다.
몇 가지 중요한 점검 사항 :
Firebug의 의견에 대한 명시 적 답변은 다음과 같습니다. 데이터가 지원하는 경우.
"My question is, when would one of either of these two situations occur? "