다른 예측 (예 : MSE)과 달리 특정 측정 오차 (예 : MAD)를 사용하는 이유는 무엇입니까?


15

MAD = 평균 절대 편차 MSE = 평균 제곱 오차

나는 몇몇 바람직하지 않은 특성에도 불구하고 MSE가 사용되는 여러 곳에서 제안을 보았다 (예 : http://www.stat.nus.edu.sg/~staxyc/T12.pdf , p8에 나와 있음) MSE보다 더 나은 기준이지만 MAD보다 수학적으로 MSE가 더 편리합니다. ")

그것보다 더 있습니까? 예측 오차를 측정하는 다양한 방법이 더 적합하거나 적은 상황을 철저히 분석하는 논문이 있습니까? 내 Google 검색 결과가 공개되지 않았습니다.

이것과 비슷한 질문이 /programming/13391376/how-to-decide-the-forecasting-method-from-the-me-mad-mse-sde 에서 요청되었으며 사용자는 stats.stackexchange.com에 게시했지만 그들이 한 것 같지는 않습니다.


2
MAD는 일반적으로 평균이 아닌 중간 절대 편차입니다.
브라이언 D

@BrianD : 더 넓은 통계 커뮤니티에서 당신이 옳습니다. 더 좁은 예측 커뮤니티에서 "MAD"는 "평균 절대 편차"인 AKA MAE 입니다.
Stephan Kolassa

답변:


23

사용할 포인트 예측 오류 측정 값을 결정하려면 한 걸음 물러서야합니다. 우리는 미래의 결과를 완벽하게 알지 못하며, 앞으로도 그러하지 않을 것입니다. 따라서 미래의 결과는 확률 분포를 따릅니다 . 일부 예측 방법은 이러한 전체 분포를 명시 적으로 출력하지만 일부는 그렇지 않습니다. 그러나 암시 적으로 만 존재하는 경우도 있습니다.

이제 우리는 포인트 예측에 대한 좋은 오차 측정을 원합니다 . 이러한 점 예측 Ft 는 소위 미래 밀도의 기능 이라는 단일 숫자를 사용하여 시간 t 에서 미래 분포 (즉, 예측 분포)에 대해 알고있는 것을 요약하려는 시도 입니다. 오류 측정은이 단일 숫자 요약의 품질을 평가하는 방법입니다.

따라서 미래 밀도의 알 수없는, 예측 가능하지만 암시적일 수있는 하나의 요약을 "좋은"보상하는 오차 측정 값을 선택해야합니다.

문제는 다른 기능에 의해 다른 오류 측정이 최소화된다는 것입니다. 예상 MSE는 미래 분포 의 예상 값 에 의해 최소화됩니다 . 예상 MAD는 미래 분포 의 중앙값 에 의해 최소화됩니다 . 따라서 MAE를 최소화하기 위해 예측을 교정하면 포인트 예측은 미래 예상 값이 아닌 미래 중앙값이되고 미래 분포가 대칭이 아닌 경우 예측이 편향됩니다.

이것은 일반적으로 기울어 진 카운트 데이터와 가장 관련이 있습니다. 극단적 인 경우 (예 : 평균 log20.69 미만의 Poisson 분산 판매 ), MAE는 평평한 영 (zero) 예측에 대해 가장 낮습니다. 자세한 내용은 여기 또는 여기 또는 여기 를 참조하십시오.

좀 더 많은 정보와의 그림 부여 민 절대 비율 오류 (MAPE)의 단점은 무엇입니까? 이 스레드는 고려 하지만 다른 오류 측정도 고려하며 다른 관련 스레드에 대한 링크를 포함합니다.


결국, 사용할 오류 측정 값은 실제로 예측 비용 오류 (예 : 가장 고통스러운 오류)에 따라 다릅니다. 예측 오류의 실제 영향을 보지 않고 "더 나은 기준"에 대한 논의는 기본적으로 의미가 없습니다.

몇 년 전 예측 커뮤니티에서 예측 정확도 측정은 큰 주제였으며 지금도 계속 나타납니다. Hyndman & Koehler는 "예측 정확도의 또 다른 예" (2006)를 살펴 보았습니다 .

마지막으로 한 가지 대안은 전체 예측 밀도를 계산하고 적절한 사용하여이를 평가하는 것 입니다.


답변과 링크에 감사드립니다. "예측 비용 오류"라는 용어에 익숙하지 않았습니다. 그것은 (예를 들어) 사업체가 얼마나 많은 위젯을 판매 할 것인지를 예측하는 상황과 관련이있는 것으로 보이며, 과대 평가로 고통받는 고통은 과소 평가로 고통받는 고통의 두 배입니다. 그러나 나는 대부분 평신도들이 예측 오류 비용을 명백히 예측하지 않고 예측하고있는 상황에 대해 생각하고있다 (예 : "빌 게이츠가 다음 5 개월 동안 얼마나 많은 트윗을 만들 것인가?"). 이러한 상황에서 내가 선택한 오류 측정은 임의적입니까?
user1205901-복원 Monica Monica

3
예측 오류의 비용은 실천 중심의 저널에서 논의 된 데다가 : forecasters.org/foresight 아주 많이 추천! (전체 공개 : 저는 편집자입니다.) 본인은 CoFE가 귀하의 예에서 쉽게 드러나지 않는다는 데 동의하지만, 귀하의 오류 측정을 최적화하기 위해 실제로 얼마나 많은 노력을 기울여야하는지 궁금합니다.
Stephan Kolassa

4

MSE 대신 MAE를 사용하는 이점은 Davydenko and Fildes (2016)에 설명되어 있습니다 (섹션 3.1 참조 ) .

... 일부 저자 (예 : Zellner, 1986)는 예측을 평가하는 기준이 예측을 최적화하는 기준과 일치해야한다고 주장합니다. 다시 말해, 주어진 손실 함수를 사용하여 추정값을 최적화하는 경우 어떤 모델이 더 나은지 알아 내기 위해 경험적 평가에 동일한 손실 함수를 사용해야합니다.

통계 모델을 피팅하면 일반적으로 2 차 손실에서 최적의 예측을 제공합니다. 예를 들어 선형 회귀를 맞출 때 발생합니다. 통계 모델링에서 밀도 예측이 대칭이면 2 차 손실에서 최적의 예측도 선형 손실에서 최적입니다. 그러나 로그 변환에 의해 분산을 안정화 한 다음 지수에 따라 예측을 다시 변환하면 선형 손실 하에서 만 최적의 예측을 얻을 수 있습니다. 다른 손실을 사용하는 경우 먼저 통계 모델을 사용하여 밀도 예측을 얻은 다음 특정 손실 함수를 고려하여 추정치를 조정해야합니다 (Goodwin, 2000에서이 작업을 수행하는 예 참조).

두 가지 방법을 실험적으로 비교하고 대칭 선형 손실 측면에서 어떤 방법이 더 나은지 알아 내고 싶다고 가정 해 봅시다 (이러한 유형의 손실은 모델링에 일반적으로 사용되므로). 시계열이 하나만 있으면 평균 절대 오차 (MAE)를 사용하는 것이 당연합니다. 또한 이해와 계산이 간단하여 MAE가 매력적입니다 (Hyndman, 2006) ...

참고 문헌

Davydenko, A. & Fildes, R. (2016). 예측 오류 측정 : 중요 검토 및 실제 권장 사항. 에서 비즈니스 예측 : 실제 문제 및 해결 방법. 존 와일리 & 아들


단순히 "Davydenko and Fildes, 2016"이 아니라 논문에 대한 전체 인용 을 줄 수 있습니까?
Silverfish

우리는 답변이 독립형이기 때문에 링크가 죽어도 악영향을받지 않습니다. 이 질문과 관련된 내용의 핵심 요점을 요약하여 답변을 다소 확장 할 수 있다고 생각하십니까? 그렇지 않으면 답변보다 주석에 더 적합합니다. (아직 의견을 게시 할만큼 평판이 좋지는 않지만 의견으로 변환 할 수 있습니다.)
Silverfish

1
답장을 보내 주셔서 감사합니다! 통계 모델에 적합하면 일반적으로 2 차 손실 하에서 최적의 예측 결과를 제공합니다. 예를 들어 선형 회귀를 맞출 때 발생합니다. 통계 모델링에서 밀도 예측이 대칭이면 2 차 손실에서 최적의 예측도 선형 손실에서 최적입니다. 그러나 로그 변환에 의해 분산을 안정화 한 다음 지수에 따라 예측을 다시 변환하면 선형 손실 하에서 만 최적의 예측을 얻을 수 있습니다.
Turbofly

1
감사! 이 정보를 답변으로 편집 할 수 있습니다 ( "편집"버튼은 게시물 하단에 있음).
Silverfish

고마워 나는 몇 가지 서식을 설정하고 전체 인용을 제공했습니다.
Silverfish

3

왜 비교하지RMSE=MSEMAE=MAD

사실은,

MAERMSEnMAE

  • e
    RMSE=1nei2=1nne2=e=MAE
  • 이자형
    MAE=en
    RMSE=1nei2=1ne2=1n(nMAE)2=nMAE

MAERMSEMAEyiy^i[0,1]

  • ei1
    MAE=nwrongn
    RMSE=1nei2=1nnwrong=MAE
    nwrongei[0,1]ei<1

RMSE가 MAE에 가까우면 작은 편차가 많고 상한에 가까우면 크게 잘못된 예측이 거의 없습니다.


sqrt (n) * MAE 또는 sqrt (n * MAE)를 상한으로 의미합니까?
Chris

1
@Chris : sqrt (n) * MAE입니다. 편집 내용을 참조하십시오.
cbeleites는
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.