어떤 상황에서 MA 프로세스 또는 AR 프로세스가 적합합니까?


21

프로세스가 자체의 이전 값에 의존하는 경우 AR 프로세스라는 것을 이해합니다. 이전 오류에 의존하는 경우 MA 프로세스입니다.

이 두 상황 중 하나가 언제 발생합니까? 프로세스를 MA와 AR로 가장 잘 모델링하는 것이 무엇을 의미하는지에 대한 근본적인 문제를 조명하는 확실한 예가 있습니까?


3
그것은 단순한 이분법이 아닙니다. 결국, AR은 무한 MA로 작성 될 수 있고 (가역) MA는 무한 AR로 작성 될 수 있으므로, 어느 쪽이든 적절하다면 다른 쪽도 마찬가지입니다.
Glen_b-복지 주 모니카

1
Glen_b, 이것에 대해 자세히 설명해 주시겠습니까? 나는 그것이 단순한 이분법이 아니라는 것을 이해한다. 나는 단순히 acf / pacf를 실행하고 싶지 않으며이 프로세스를 잘 알고 있다고 가정합니다.
매트 오브라이언

답변:


10

중요하고 유용한 결과 중 하나는 Wold 표현 정리 (때로는 Wold 분해라고 함)인데, 이는 모든 공분산-정지 시계열 를 두 개의 시계열, 하나의 결정론 및 확률론의 합으로 작성할 수 있다고 말합니다 .Yt

Yt=μt+j=0bjεtj , 여기서 는 결정적입니다.μ

두 번째 용어는 무한 MA입니다.

(무제한 MA를 무한 AR 프로세스로 작성할 수있는 경우도 있습니다.)

이것은 계열이 공분산-고정 적이고 결정 론적 부분을 식별 할 수 있다고 가정하면 확률 론적 부분을 항상 MA 프로세스로 작성할 수 있음을 나타냅니다. 마찬가지로 MA가 가역성 조건을 만족하는 경우 항상 AR 프로세스로 작성할 수 있습니다.

한 양식으로 작성된 프로세스가있는 경우 종종 다른 양식으로 변환 할 수 있습니다.

따라서 어떤 의미에서 공분산 고정 계열의 경우 종종 AR 또는 MA가 적합합니다.

물론 실제로는 큰 모델이 없습니다. 유한 AR 또는 MA가있는 경우 ACF 및 PACF는 결국 기하학적으로 붕괴됩니다 (두 함수 중 하나의 절대 값이 아래에있는 기하학적 함수가 있음). 이는 AR 또는 다른 형태의 MA는 종종 합리적으로 짧을 수 있습니다.

따라서 공분산 정지 조건 하에서 결정 론적 및 확률 론적 구성 요소를 식별 할 수 있다고 가정하면 AR과 MA가 모두 적절할 수 있습니다.

Box 및 Jenkins 방법론은 매개 변수가 거의없는 AR, MA 또는 ARMA 모델 인 모순적인 모델을 찾습니다. 일반적으로 ACF와 PACF는 모델을 식별하기 위해 사용됩니다. 잔차 계열이 화이트 노이즈와 합리적으로 나타날 때까지 잔차 구조 (일반적으로 잔차에서 ACF 및 PACF를 통해). 종종 일련의 근사값을 제공 할 수있는 여러 모델이 있습니다. 실제로 다른 기준이 종종 고려됩니다.

이 접근법에 대한 비판에는 몇 가지 근거가 있습니다. 예를 들어, 이러한 반복 프로세스로 인한 p- 값은 일반적으로 (데이터를보고) 모델이 도착한 방식을 고려하지 않습니다. 예를 들어, 샘플 분할을 통해이 문제를 적어도 부분적으로 방지 할 수 있습니다. 두 번째 비판의 예는 실제로 정지 시리즈를 얻는 것이 어렵다는 점입니다. 많은 경우에 정상과 합리적으로 일치하는 시리즈를 얻기 위해 변형 할 수 있지만, 실제로는 그렇지 않습니다 (유사한 문제는 일반적입니다) 통계 모델에 문제가있을 수 있지만 때로는 여기에서 더 문제가 될 수 있습니다).

[억세스 라우터와 해당 무한 MA 간의 관계는 Hyndman 및 Athanasopoulos '에서 설명한 예측 : 원리 및 연습 , 여기 ]


1
-1 흥미롭지 만 질문의 정신에 실제로 답하지는 않기 때문입니다.
Jake Westfall

제이크 안녕하세요-답변에 문제가 있다고 생각하는 의견을 추가해 주셔서 감사합니다. 이것은 downvote 만 사용하는 것보다 훨씬 더 유용합니다. 나는 여기에 부족한 것이 있다는 데 동의합니다. 최소한 그것이 왜 대답으로 게시하기에 충분히 관련이 있다고 생각했는지 분명히해야합니다.
Glen_b-복지 주 모니카

1
@ Jake 나는 질문에 대한 명확한 연결을 위해 약간의 편집 작업을 수행했습니다. 도와 주셔서 다시 한 번 감사드립니다
Glen_b -Reinstate Monica

편집 해 주셔서 감사합니다. 다운 보트를 제거했습니다. 수정 된 답변을 한 문장으로 요약하면 다음과 같습니다. "많은 경우에 AR 또는 MA 모델이 다른 데이터뿐만 아니라 데이터에도 적합 할 수 있기 때문에 일반적으로 대답하기 어려운 질문입니다. " 질문에 대한 합법적이고 실망스러운 답변입니다.
Jake Westfall

@Jake는 여전히 예약이있는 경우 downvote를 제거 할 필요가 없다고 생각합니다. 어느 쪽이든 대답을 향상시킬 수있는 기회에 감사드립니다.
Glen_b-복지 주 모니카

5

나는 질문의 첫 번째 부분에 대한 매력적인 답변이라고 생각하는 것을 제공 할 수 있지만 ( "MA?"?) 현재 질문의 두 번째 부분에 대해 동일한 매력적인 답변을 생각하고 있습니다 ( "AR ??").

연속 일에 주식의 종가 (스플릿 및 배당으로 조정)로 구성된 시리즈를 고려하십시오. 매일 마감 가격은 추세 (예 : 선형)와 전날의 일일 충격에 대한 가중 효과에 더해집니다. 아마도 t-1 일차 충격의 영향은 t-2 일차 충격보다 t 일차 가격에 더 큰 영향을 미칠 것으로 예상됩니다. 따라서 논리적으로, t 차일의 종가는 추세를 반영합니다. t 일째 값에 t-1 일까지의 충격에 대한 가중 합계의 상수 (1 미만)에 1을 곱한 값 (예 : t-1 일의 오류 항) (MA1)에 상수 (1 미만)를 더한 값 t-2 일까지의 충격의 가중 합계 (즉, t-2 일의 오차 항) (MA2)를 곱한 다음 t의 새로운 충격 (화이트 노이즈). 이러한 종류의 모델은 주식 시장과 같은 시리즈를 모델링하는 데 적합 해 보입니다. 여기서 t 일의 오류 항은 이전 및 현재 충격의 가중 합계를 나타내며 MA 프로세스를 정의합니다. 전적으로 AR 프로세스에 대해 똑같이 설득력있는 이론을 연구하고 있습니다.


3
+1. 이것은 원래의 질문에 대답하려고 시도한 유일한 대답입니다.
S. Kolassa-복직 모니카

내가 올바르게 이해한다면 AR 과정이 되풀이되는 경향을 교정하는 데 더 나은 것처럼 들리지만 MA는 되풀이되지 않는 큰 충격을 교정하는 데 더 좋습니다.
마이크 캠벨

0

이것은 AR, MA 및 ARMA 프로세스를 시각화하는 데 도움이되는 가장 간단한 예입니다.

이것은 주제에 대한 소개를위한 시각적 인 도움 일 뿐이며 모든 가능한 경우를 설명 할만큼 엄격하지는 않습니다.

다음을 가정 해 봅시다 : 우리는 경쟁에서 특정 종류의 행동을 수행하는 임무를 가진 두 명의 요원이 있습니다 (오른쪽으로 수평으로 점프).

  1. "인간"은 평균적으로 물리적 능력에 따라 점프 할 때마다 "deviation"의 표준 편차로 "μ"의 거리를 커버 할 것으로 예상됩니다. 그러나, 인간은 특히 정신력이 부족합니다. :) 그의 성과는 또한 이전 점프가 지연되거나 / 미치거나 / 그의 기대를 초과했는지 여부에 달려 있습니다.

  2. "기계"는 단 하나의 차이점만으로 위의 인간과 정확히 동일한 사양으로 설계되었습니다. 기계는 감정이 없으며 과거의 성능에 영향을받지 않습니다.

또한 두 에이전트가 두 개의 점프를 포함하는 각 게임과 함께 두 개의 게임을 수행해야합니다.

  1. "Final Jump"는 워밍업 점프 후 최종 점프에서 커버 된 거리를 기준으로 득점했으며, 그 결과는 경쟁에서 무시되었지만 인간이 관찰 할 수 있습니다. 워밍업 점프가 시작되는 곳에서 마지막 점프가 시작됩니다.

  2. "Combined Jump"는 최초 및 최종 점프에서 포함 된 결합 거리를 기준으로 득점했습니다. 최종 점프는 초기 점프가 시작되는 곳에서 시작됩니다.

아래 차트는 위의 배우 및 게임과 관련된 네 가지 시나리오 각각을 가장 잘 설명하는 모델을 보여줍니다.

AR, MA 및 ARMA 프로세스의 차이점을 설명하는 다이어그램


이 포스터는 이해할 수있는 설명과 배경이 필요합니다. 당신의 대답에 그것을 공급할 수 있습니까?
whuber

-1

따라서 일 변량 시계열을 가지고 있으며 모델링 / 예측하고 싶습니까? ARIMA 유형 모델을 사용하도록 선택했습니다.

의 매개 변수는 데이터 세트에 가장 적합한 것에 따라 다릅니다. 그러나 어떻게 알 수 있습니까? 최근의 접근 방식은 Hyndman & Khandakar (2008)의 "자동 시계열 예측"입니다 ( pdf ).

이 알고리즘은 다른 버전의 p, q, P 및 Q를 시도하고 AIC, AICc 또는 BIC가 가장 작은 것을 선택합니다. 그것은 예측 R 패키지 의 auto.arima () 함수에서 구현 됩니다 . 정보 기준의 선택은 함수에 전달할 매개 변수에 따라 다릅니다.

선형 모델의 경우 가장 작은 AIC를 가진 모델을 선택하면 일대일 교차 검증이 가능합니다.

또한 최소 4 년 동안 충분한 데이터가 있는지 확인해야합니다.

몇 가지 중요한 점검 사항 :

  1. 모델이 이해가 되나요? 예를 들어, 월간 소매 판매가있는 경우 계절 모델이 적합 할 수 있습니다.
  2. 표본에서 얼마나 잘 예측합니까?

Firebug의 의견에 대한 명시 적 답변은 다음과 같습니다. 데이터가 지원하는 경우.


3
이 답변은 전혀 질문에 대답하지 않습니다 :"My question is, when would one of either of these two situations occur? "
Firebug

1
"아래 Firebug의 의견에 대한 명확한 답변 : 데이터가 지원할 때." 나는 @Firebug에 동의합니다-이것은 질문에 대한 답변이 아니며 두 가지를 구별하는 확실한 예가 아닙니다.
Thomas

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.