답변:
두 개의 경쟁 추정기 및 경우 여부에 따라 은 더 나은 견적은 전적으로 귀하의 "최고"에 대한 정의에 달려 있습니다. 예를 들어, 편향되지 않은 추정값을 비교하고 "더 나은"경우 분산이 더 낮다는 것을 의미합니다. 예, 이는 이 더 낫다 는 것을 의미합니다 . 는 Least Squares 및 Gaussian log-like와 관련이 있기 때문에 널리 사용되는 기준이지만 많은 통계 기준과 마찬가지로 를 사용하지 않도록주의해야합니다. θ 2MSE( θ 1)<MSE( θ 2) θ 1 θ 1MSEMSE
를 최소화하기 위해 추정기를 선택하는 것이 특히 합리적이지 않은 상황이 있습니다. 두 가지 시나리오가 떠 오릅니다.
데이터 세트에 매우 큰 특이 치가있는 경우 MSE에 큰 영향을 미칠 수 있으므로 MSE를 최소화하는 추정기는 이러한 특이 치에 의해 영향을받을 수 있습니다. 이러한 상황에서 추정값이 MSE를 최소화한다는 사실은 특이 치를 제거하면 크게 다른 추정치를 얻을 수 있기 때문에 실제로 많은 것을 알려주지 않습니다. 그런 의미에서 MSE는 특이 치에 "강력한"것이 아닙니다. 회귀의 맥락 에서이 사실은 Huber M-Estimator (이 답변에서 논의)에 동기를 부여한 것으로, 긴 꼬리 오류가있을 때 다른 기준 기능 (제곱 오차와 절대 오차의 혼합)을 최소화합니다 .
경계 매개 변수를 추정하는 경우, 비교 는 그렇지 않은 경우 과대 평가 및 과소 평가하기 때문에 적절하지 않을 수 있습니다. 예를 들어, 분산 추정한다고 가정합니다 . 그런 다음 의식적으로 수량을 과소 평가하면 가 최대 일 수 있지만 과대 평가로 인해 를 훨씬 초과 하는 를 생성 할 수 있습니다 .σ 2 M S E σ 4 M S E σ 4
이러한 결점을보다 명확하게하기 위해, 이러한 문제로 인해 가 추정기 품질의 적절한 척도가 아닐 수 있는 구체적인 예를 들어 보겠습니다 .
당신은 샘플이 가정 A로부터 와 유통 t ν > 2 ν / ( ν - 2 ) θ 1 : t 시간 E U N B I S E D S m의 P는 L E V R I N C E θ 2 = 0 , R E g R에 D자유도 을 추정하려고한다고 가정합니다 . 두 개의 경쟁하는 추정기를 고려 와 분명히 그리고 사용하여 파생 될 수있는
결론은 은이 시나리오에서 가 적절한 측정 추정기 성능이 아니라는 것 입니다. 이는 측면에서 지배적 인 추정값이 우스운 것이기 때문에 분명합니다 (특히 관찰 된 데이터에 변동성이있을 경우 정확할 가능성이 없기 때문에). 아마도 Casella와 Berger가 지적한 것처럼 더 적절한 접근 방식은 Stein 's Loss를 최소화 하는 분산 추정기 를 선택하는 것입니다 .
과소 평가는 과대 평가에 똑같이 과소 평가를 부과합니다. 또한 이래로 우리를 정신 건강 상태로 :)
함수 는 구별 할 수 있기 때문에 이론적 및 수치 적 관점에서 최소 MSE를 쉽게 찾을 수 있습니다. 예를 들어, 보통 최소 제곱에서 적합 경사 및 절편에 대한 명시 성을 해결할 수 있습니다. 수치 적 관점에서 볼 때 파생물이있을 때 더 효율적인 솔버가 있습니다.
평균 제곱 오차는 일반적으로 내 의견으로는 이상 값을 과체중합니다. 그렇기 때문에 평균 절대 오차를 사용하는 것이 더 강력합니다. 즉오류 기능으로. 그러나 구분할 수 없기 때문에 솔루션 작업이 더 어려워집니다.
오류 항이 정규 분포를 따르는 경우 MSE가 적합합니다. 꼬리가 굵은 경우 절대 값과 같은보다 강력한 선택이 바람직합니다.