답변:
이 질문은 꽤 오래되었지만 실제로 여기에 표시되지 않는 답변이 있으며 다른 합리적인 힘이있는 동안 (일부 합리적인 가정 하에서) 제곱 오류가 정확한 이유를 제시합니다.
데이터가 이고 이 데이터를 관찰하기위한 확률 밀도 가 와 관련하여 최대이어야 한다는 점에서 데이터를 가장 잘 예측 하는 선형 (또는 기타) 함수 를 찾으십시오 ( 최대 가능성 추정 이라고 함 ). 우리는 데이터가 부여된다고 가정하면 표준 편차를 갖는 정규 분포 에러 항을 더한 후 이것은 f p f ( D ) fσ p f ( D ) = n ∏ i = 1 1
x ^ 2 이외의 규범을 최소화 할 수 없었던 이유는 없습니다. 예를 들어, 양자 회귀에 관해 쓰여진 책이 전부 있습니다. 예를 들어, | x | 중간 값으로 작업하는 경우 일반적으로 수행하기가 더 어렵고 오류 모델에 따라 좋은 추정량을 제공하지 않을 수 있습니다 (상황에서 저 분산 또는 편향 또는 낮은 MSE 추정기를 의미하는지 여부에 따라 다름).
왜 우리가 실수 값 모멘트보다 정수 모멘트를 선호하는지에 대한 주된 이유는 실수의 정수 제곱은 항상 실수를 초래하지만 음수가 아닌 정수 제곱은 복소수를 생성하므로 절대 값. 다시 말해서 실수 랜덤 변수의 3 번째 모멘트는 실제이지만 3.2 번째 모멘트는 반드시 실제가 아니므로 해석 문제가 발생합니다.
그 이외의...
디스크립터 내에 남아있는 분산을 최소화하려고합니다. 왜 분산인가? 이 질문을 읽으십시오 ; 이것은 또한 오류가 정상적으로 분산된다는 (대부분 침묵) 가정과 함께 제공됩니다.
확장 :
두 가지 추가 인수 :
분산의 경우, 우리는 분산의 합이 상관되지 않은 표본에 대한 합의 분산과 같다는이 멋진 "법칙"이 있습니다. 오차가 사례와 상관 관계가 없다고 가정하면, 잔차를 최소화하는 것은 설명 된 분산을 최대화하는 데 간단하게 작용할 것입니다.
오차의 정규성을 가정하면 최소 제곱 오차 추정기는 최대 가능성입니다.
보통 최소 제곱에서 (A'A) ^ (-1) x = A'b에 대한 해는 제곱 오차 손실을 최소화하며 최대 우도 해입니다.
이 역사적인 경우에는 수학이 쉬웠 기 때문입니다.
그러나 일반적으로 사람들 은 지수, 물류, 코시, 라플라스, 후버 등과 같은 여러 가지 손실 함수를 최소화합니다 . 이보다 이국적인 손실 함수에는 일반적으로 많은 계산 리소스가 필요하며 일반적으로 폐쇄 형 솔루션이 없기 때문에 그들은 이제 더 대중화되기 시작했습니다.