MEAN이 ARIMA보다 성능이 우수하지 않은가?


37

나는 최근에 다양한 예측 방법 (MEAN, RWF, ETS, ARIMA 및 MLP)을 적용했으며 MEAN이 놀랍게 잘 작동하는 것을 발견했습니다. (MEAN : 모든 미래 예측이 관측 된 값의 산술 평균과 같은 것으로 예측되는 경우) MEAN은 내가 사용한 3 개의 시리즈에서 ARIMA보다 성능이 우수했습니다.

내가 알고 싶은 것은 이것이 비정상적인 것입니까? 이것은 내가 사용하는 시계열이 이상하다는 것을 의미합니까? 아니면 내가 잘못 설정했음을 나타 냅니까?



@Mehrdad는 Martingales를 중심으로 멋진 답변을 만들 수 있습니다.
shadowtalker

1
간단한 방법, 특히 샘플 외부 (중요한 부분)가 잘 수행되는 것이 일반적입니다. 이 효과는 짧은 시리즈 일수록 강해집니다. 연속적인 상관 관계 나 경향이 많지 않으면 상대적으로 긴 계열에서도 평균이 매우 잘 작동 할 것으로 예상됩니다.
Glen_b

답변:


31

나는 예측의 프로듀서이자 사용자이며 실무자이며 숙련 된 통계학자는 아닙니다. 아래에서는 경험적 증거에 의존하는 연구 기사를 참조하여 평균 예측이 ARIMA보다 나은 이유에 대한 몇 가지 생각을 공유합니다. 다시 한 번 참고로 돌아가는 한 권의 책은 암스트롱 의 예측 원칙 (Principles of Forecasting) 책과 그 웹 사이트 입니다.

당신에게 첫 번째 질문에 대답하기 위해 -이것이 이상한 경우인지 알고 싶습니다.

동일한 웹 사이트 에서 무료로 제공되는 시계열 및 교차 데이터에 대한 외삽이라는 장이 있습니다 . 다음은이 장의 인용문입니다

"예를 들어, 월간 시리즈 29 개를 조사한 실시간 M2 경쟁에서 Box-Jenkins는 가장 정확한 방법 중 하나이며 전체 평균 오차는 순진한 예측보다 17 % 더 컸습니다."

평균 예측이 ARIMA 모델보다 나은 이유에 대한 경험적 증거가 있습니다.

경험적 경쟁과 Box-Jenkins ARIMA 접근법을 보여주는 세 번째 M3 경쟁 에 대한 연구 후에 연구가 진행되었습니다 .

같은 웹 사이트 에 Greene and Armstrong의 " 간단한 예측 : 잠자기 전에 눈물을 피하십시오 "라는 제목의 또 다른 논문과 지속적인 연구가 있습니다. 이 논문의 저자는 다음과 같이 요약합니다.

전체적으로 우리는 복잡한 방법의 예측 정확도와 단순한 방법 (모든 경우에 정교하게 간단한 것은 아님)의 예측 정확도에 대한 94 개의 공식 비교를 통합 한 29 개의 논문을 식별했습니다. 비교의 83 %는 간단한 방법의 예측이 복잡한 방법의 예측보다 정확하거나 유사하다는 것을 발견했습니다. 평균적으로 복잡한 방법의 예측 오차는 오류 비교를 제공하는 21 개의 연구에서 간단한 방법의 예측 오차보다 약 32 % 더 컸습니다.

세 번째 질문에 대답하기 위해 : 내가 잘못 설정했음을 나타 냅니까? 아니요, ARIMA를 복잡한 방법으로, 평균 예측을 간단한 방법으로 고려합니다. 평균과 같은 간단한 방법이 ARIMA와 같은 복잡한 방법보다 성능이 우수하다는 충분한 증거가 있습니다.

두 번째 질문에 대답하려면 : 이것은 내가 사용하는 시계열이 이상하다는 것을 의미합니까?

다음은 실제 예측 전문가라고 생각한 것입니다.

  • Makridakis (M, M2 및 M3이라는 예측에 대한 선구적인 경험적 경쟁, 예측의 증거 기반 방법을위한 포장 된 방법)
  • 암스트롱 (예측 연습에 관한 서적 / 기사 형태의 귀중한 통찰력 제공)
  • Gardner (아리마에 비해 놀랍도록 잘 작동하는 또 다른 간단한 방법을 개발 한 Damped Trend 지수 지수를 발명 함)

위의 모든 연구자들은 단순성 (평균 예측과 같은 방법) 대 ARIMA와 같은 복잡한 방법을 옹호합니다. 따라서 예측이 양호하고 경험적 증거를 기반으로 한 복잡성보다 항상 단순성을 선호한다는 점이 편안해야합니다. 이 연구원들은 모두 응용 예측 분야에 크게 기여했습니다.

Stephan의 간단한 예측 방법에 대한 훌륭한 목록 외에도. Theta 예측 방법이라는 또 다른 방법도 있습니다.이 방법 은 매우 간단한 방법입니다 (선형 회귀 기울기의 1/2에 해당하는 드리프트로 기본적으로 간단한 지수 평활).이를 도구 상자에 추가합니다. Forecast package in R이 메소드를 구현합니다.


2
나는 당신이 예측에 관해 당신이 제공 한 관점과 그것을지지하기 위해 제안하는 증거를 정말로 좋아하지만,이 답변의 요소들은 "통계 학자"또는 공식적인 통계 훈련에 대한 격언처럼 너무 많이 읽었 기 때문에 불쾌합니다. . 예를 들어, Makridakis의 고급 학위는 (추측 내용은 무엇입니까?) 통계있으며, 이것이 그가 가르치는 것입니다.
whuber

1
알겠습니다. 제거하겠습니다. 증거 기반 방법의 주요 발전이 비 통계 학자로부터 나온다는 점을 지적하려고했습니다. 그러나 나는 당신의 요점을 알 수 있습니다
예측 자


FWIW는 자신의 링크드 인 페이지를 실현합니다 그는 유지 - 통계 목록을 모두 자신의 박사 학위. 그러나 그 주장은 의미가 없다. 누군가 통계학이 아닐 수도 있기 때문에 통계학자가 아니라고 주장하는 것은 가치가 거의 없으며 여기의 요점 밖에있다. (최근까지 통계 분야에서 경력을 쌓은 대부분의 사람들은 통계 프로그램이 거의 없었기 때문에 다른 분야에서 학위를 받았습니다.)
whuber

2
+1. 그러나 "평균 예측이 ARIMA 모델보다 나은 이유에 대한 경험적 증거가 있습니다." -아니오, 이것은 우리 아닌 평균이 더 나은 것임을 알려줍니다 . 나는 논쟁을 돌이켜 ARIMA와 다른 모델에 대한 증거의 부담을 가중시켰다. 데이터 생성 프로세스가 내 모델에 대한 과거 오류를 처리해야하는지 이해하지 못했습니다 . 이것이 MA 용어가 본질적으로 모델링하는 것입니다. 내 개인적인 의혹은 ARIMA가 매우 인기가 있다는 것입니다. ARIMA는 예측이 아니라 단위 뿌리 및 고정 성과 같은 것을 실제로 증명할 수 있기 때문입니다.
S. Kolassa-복원 모니카

36

이것은 전혀 놀라운 일아닙니다 . 예측에서는 매우 자주 같이하는 매우 간단한 방법을 찾을 수

  • 전체 평균
  • 순진한 랜덤 워크 (예 : 예측으로 사용 된 마지막 관측치)
  • 계절에 따른 무작위 보행 (즉, 1 년 전의 관측)
  • 단일 지수 평활

보다 복잡한 방법보다 성능이 우수합니다. 그렇기 때문에 항상이 간단한 벤치 마크에 대해 분석법을 테스트해야합니다.

George Athanosopoulos와 Rob Hyndman (현장 전문가) 의 인용문 :

일부 예측 방법은 매우 간단하고 놀랍도록 효과적입니다.

매우 간단한 방법을 벤치 마크로 사용하겠다고 명시 적으로 말한 것에 주목하십시오.

실제로, 예측에 대한 전체 무료 공개 온라인 교과서 가 매우 권장됩니다.

편집 : 더 잘 수용 된 예측 오류 측정 중 하나 인 Hyndman & Koehler의 MASE (Mean Absolute Scaled Error) ( 여기 참조 )는 (샘플 내) 순진한 무작위 보행 예측에서 주어진 예측이 얼마나 향상되는지 측정합니다. <1, 샘플 내 랜덤 워크보다 예측이 좋습니다. 당신은 이것이 쉽게 구타 당할 것이라고 기대할 것입니다.

그렇지 않은 경우도 있습니다. 때로는 ARIMA 또는 ETS와 같은 여러 표준 예측 방법 중 최고만으로도 MASE 1.38 만 산출됩니다. 즉, (샘플 내) 랜덤 워크 예측보다 (샘플이 아닌) 더 나쁩니다 . 이것은 여기에 질문을 생성하기에 충분히 당황 스럽습니다. (이 질문은 MASE가 표본 외 정확도를 순진한 방법의 표본 내 정확도와 비교하기 때문에이 질문과 중복되지는 않지만, 현재 질문을 밝히고 있습니다.)


1
수락 해주셔서 감사합니다.하지만 하루를 기다릴 수도 있습니다. 질문에 대한 답변이 받아 들여지면 더 적은 수의 사람들이 의견을 말하거나 대답하지 않고서도 그것을 읽습니다. 그리고 다른 사람들은 이것에 대해 다른 테이크를 가질 수 있습니다. ;-)
S. Kolassa-Reinstate Monica

당신에게 매우 정직합니다 :) 나는 그것을 하루 줄 것입니다. 감사.
Andy T

9
"복잡한"은 "과적 합 된"의 가까운 친척입니다.
shadowtalker

1
+1 좋은 답변. 예측이 의학과 같은 증거 기반 필드라면 ARIMA 방법은 역사 일 것입니다.
예측 자

2
가우시안 가정을 ​​검증하지 않고 단순한 마음을 가진 ARIMA는 이미 대부분의 사람들에게 역사가 있지만 분명히 모든 것은 아닙니다!
IrishStat
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.