절대 오차 또는 평균 제곱 오차를 의미합니까?


58

왜 평균 절대 오차 (MAE) 대신 RMSE (루트 평균 제곱 오차)를 사용합니까?

안녕하세요

계산에서 생성 된 오류를 조사했습니다. 처음에는 오류를 루트 평균 정규화 제곱 오류로 계산했습니다.

좀 더 자세히 살펴보면 오차를 제곱하는 효과가 작은 오차보다 큰 오차에 더 많은 가중치를 부여하여 오차 추정치를 홀수 이상 값으로 기울입니다. 이것은 회고에서 분명합니다.

그래서 내 질문은-어떤 경우에 제곱 평균 오차가 평균 절대 오차보다 더 적절한 오차 측정치입니까? 후자가 나에게 더 적합한 것 같습니까?

이를 설명하기 위해 아래 예제를 첨부했습니다.

  • 산포도는 상관 관계가 좋은 두 변수를 보여줍니다.

  • 오른쪽 차트의 두 히스토그램은 정규화 된 RMSE (위)와 MAE (아래)를 사용하여 Y (observed)와 Y (predicted) 사이의 오류입니다.

여기에 이미지 설명을 입력하십시오

이 데이터에는 유의 한 특이 치가 없으며 MAE는 RMSE보다 오류가 낮습니다. 하나의 오차 측정치를 다른 것에 비해 사용하기에 MAE 이외의 다른 합리적인 이유가 있습니까?


9
RMSE와 MAE는 서로 다른 두 가지 오차 측정치이므로 (RMAE가 RMSE보다 "낮음"이라는 주장과 관련된) 수치 비교는 의미가없는 것으로 보입니다. 이 선은 몇 가지 기준에 따라 적합해야합니다. 어떤 기준 이든, 해당 기준은 관련 오류 측정 값이어야합니다.
whuber

선은 최소 제곱을 사용하여 피팅되었지만 그림은 측정 오차의 차이를 보여주는 예일뿐입니다. 내 실제 문제는 최적화 프로그램을 사용하여 최소화 된 오류, MAE 또는 RMSE를 측정하는 네 가지 기능 매개 변수를 해결하는 것입니다.
user1665220

명확하게 해 주셔서 감사합니다. 그러나 정확히 어떤 오류에 관심이 있습니까? 의 오류 에 맞게 또는의 오류 매개 변수 추정 ?
whuber

1
적합에 오류가 있습니다. y를 제공하는 실험실 샘플이 있는데 함수를 사용하여 예측하고 싶습니다. 관측 된 데이터와 예측 된 데이터 사이의 적합도에 대한 오차를 최소화하여 4 지수에 대한 함수를 최적화합니다.
user1665220

RMSE에서는 품목 수의 근 (n)을 고려합니다. 그것은 MSE의 루트를 n의 루트로 나눈 값입니다. MSE의 근은 괜찮지 만 n으로 나누지 않고 RMSE를 받기 위해 n의 근으로 나눕니다. 나는 그것이 정책이 될 것이라고 생각하고 있습니다. 현실은 (Route of MSE) / n입니다. 그런 식으로 MAE가 더 좋습니다.

답변:


57

이것은 손실 기능에 따라 다릅니다. 많은 경우에 평균에서 멀어 질수록 더 많은 가중치를 부여하는 것이 합리적입니다. 즉, 10만큼 벗어난 것은 5만큼 떨어져있는 것보다 2 배 이상 나쁜 것입니다. 이러한 경우 RMSE가보다 적절한 오류 측정입니다.

10 시가 5 시보 다 2 배나 나쁘면 MAE가 더 적합합니다.

어쨌든, 마지막 문장에서와 같이 RMSE와 MAE를 서로 비교하는 것은 이치에 맞지 않습니다 ( "MAE는 RMSE보다 오류가 낮습니다"). MAE는 계산 방식으로 인해 RMSE보다 높을 수 없습니다. 동일한 오류 측정과 비교하여 의미가 있습니다. 방법 1의 RMSE와 방법 2의 RMSE 또는 방법 1의 MAE와 방법 2의 MAE를 비교할 수 있지만 MAE가 방법의 RMSE보다 낫다고 말할 수는 없습니다. 더 작기 때문에 1입니다.


MAE가 RMSE보다 높지 않다는 것을 이해합니다. 나는 오류 추정치를 모두 사용하고 값의 차이를보고 이상치의 영향을 나타냅니다. 즉, 그들이 가까이있을 때, 더 멀리 떨어져있을 때 나는 무슨 일이 일어나고 있는지 조사합니다. 궁극적으로 데이터에 가장 적합한 매개 변수를 예측하고 싶습니다. 예를 들어 9 % 오류 사운드가 12 %보다 낫습니다. 올바른 이유 때문에 올바른 것을 선택하고 싶었습니다. 당신의 충고를
응원

RMSE (결과적으로 MSE)와 MAE의 주요 차이점은 가중치 오류 방식에 관한 것이 아닙니다. 필요한 경우 가중치 기능을 사용할 수 있습니다. 가장 큰 차이점은 MSE가 L2 Space와 관련되어 있다는 것입니다 (MAE에는 그런 것이 없습니다). 예를 들어, MSE는 E가 피드백 신호일 때 폐쇄 루프 제어에 필요한 에너지 양을 측정 할 수 있습니다 (신호의 평균 제곱 기억,이 경우 오류는 에너지에 비례합니다). 또한 Marquardt-Levenberg와 같은 많은 수학 및 결과 알고리즘이이 공간에서 작동합니다. 간단히 말해서 MSE를 목적 함수로 사용합니다.
eulerleibniz

17

MAE 대신 (R) MSE를 사용하려는 경우의 또 다른 상황은 다음과 같습니다. 관측치의 조건부 분포가 비대칭이고 편향되지 않은 적합을 원하는 경우. 제 (R)는 MSE 조건으로 최소화 평균 조건부함으로써, MAE을 메디안 . 따라서 MAE를 최소화하면 적합이 중앙값에 더 가깝고 편향됩니다.

물론,이 모든 것은 실제로 손실 기능에 달려 있습니다.

MAE 또는 (R) MSE를 사용하여 예측 또는 예측 을 평가하는 경우에도 동일한 문제가 발생 합니다 . 예를 들어, 소량 판매 데이터는 일반적으로 비대칭 분포를 갖습니다. MAE를 최적화하면 MAE 최적화 예측이 플랫 제로 예측이라는 사실에 놀랄 수 있습니다.

여기 이것을 다루는 약간의 프리젠 테이션이 있으며, 여기이 효과를 설명하는 M4 예측 경쟁에 대한 최근의 논평이 있습니다.


+1. 분포를 비교하는 아이디어는 훌륭하지만 ... 현재와 같은 메트릭은 비참하게 실패하지 N = 1e3; set.seed(1); y = rpois(N, lambda=1); yhat = c(y[2:N],0)않습니까? 예측 밀도 "차이"는 최소이지만 실제 yhat는 쓸모가 없습니다. 물론 이것은 극단적 인 경우입니다. (나는 분명한 것을 놓치고 있을지도 모른다. 사전에 그 논문에 접근 할 수는 없다.)
usεr11852는 Reinstate Monic

y^=1

설명을 해주셔서 감사합니다. 프레젠테이션을 더 잘 개념화 할 수 있습니다. (흠 ... 결국 당신의 종이를
가져와야

@ usεr11852 : 이메일로 연락 주시기 바랍니다 ( 여기서 주소 찾기 ) – 메일이 스팸 필터로 끝나지 않으면 기꺼이 그 종이를 보내 드리겠습니다.
S. Kolassa-복원 모니카

@ usεr11852 "like N ="이후에 당신을 완전히 잃었습니다.
sak

5

여기에 이미지 설명을 입력하십시오

RMSE는 유클리드 거리의 손실을 설명하는보다 자연스러운 방법입니다. 따라서 3D로 그래프를 그리면 위의 녹색으로 볼 수 있듯이 손실은 원뿔 모양입니다. 시각화하기는 어렵지만 더 높은 차원에도 적용됩니다.

MAE는 도시-블록 거리로 생각할 수 있습니다. 그래프에서 파란색으로 볼 수 있듯이 손실을 측정하는 방법은 자연스럽지 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.