사용할 포인트 예측 오류 측정 값을 결정하려면 한 걸음 물러서야합니다. 우리는 미래의 결과를 완벽하게 알지 못하며, 앞으로도 그러하지 않을 것입니다. 따라서 미래의 결과는 확률 분포를 따릅니다 . 일부 예측 방법은 이러한 전체 분포를 명시 적으로 출력하지만 일부는 그렇지 않습니다. 그러나 암시 적으로 만 존재하는 경우도 있습니다.
이제 우리는 포인트 예측에 대한 좋은 오차 측정을 원합니다 . 이러한 점 예측 Ft 는 소위 미래 밀도의 기능 이라는 단일 숫자를 사용하여 시간 t 에서 미래 분포 (즉, 예측 분포)에 대해 알고있는 것을 요약하려는 시도 입니다. 오류 측정은이 단일 숫자 요약의 품질을 평가하는 방법입니다.
따라서 미래 밀도의 알 수없는, 예측 가능하지만 암시적일 수있는 하나의 요약을 "좋은"보상하는 오차 측정 값을 선택해야합니다.
문제는 다른 기능에 의해 다른 오류 측정이 최소화된다는 것입니다. 예상 MSE는 미래 분포 의 예상 값 에 의해 최소화됩니다 . 예상 MAD는 미래 분포 의 중앙값 에 의해 최소화됩니다 . 따라서 MAE를 최소화하기 위해 예측을 교정하면 포인트 예측은 미래 예상 값이 아닌 미래 중앙값이되고 미래 분포가 대칭이 아닌 경우 예측이 편향됩니다.
이것은 일반적으로 기울어 진 카운트 데이터와 가장 관련이 있습니다. 극단적 인 경우 (예 : 평균 log2≈0.69 미만의 Poisson 분산 판매 ), MAE는 평평한 영 (zero) 예측에 대해 가장 낮습니다. 자세한 내용은 여기 또는 여기 또는 여기 를 참조하십시오.
좀 더 많은 정보와의 그림 부여 민 절대 비율 오류 (MAPE)의 단점은 무엇입니까? 이 스레드는 mape을 고려 하지만 다른 오류 측정도 고려하며 다른 관련 스레드에 대한 링크를 포함합니다.
결국, 사용할 오류 측정 값은 실제로 예측 비용 오류 (예 : 가장 고통스러운 오류)에 따라 다릅니다. 예측 오류의 실제 영향을 보지 않고 "더 나은 기준"에 대한 논의는 기본적으로 의미가 없습니다.
몇 년 전 예측 커뮤니티에서 예측 정확도 측정은 큰 주제였으며 지금도 계속 나타납니다. Hyndman & Koehler는 "예측 정확도의 또 다른 예" (2006)를 살펴 보았습니다 .
마지막으로 한 가지 대안은 전체 예측 밀도를 계산하고 적절한 점수 규칙을 사용하여이를 평가하는 것 입니다.