제목은 모든 것을 말합니다. 최소 오차와 최대 확률은 모형의 오차가 정규 분포를 따르는 경우 회귀 계수에 대해 동일한 결과를 제공한다는 것을 이해합니다. 그러나 오류가 정상적으로 분포되지 않으면 어떻게됩니까? 두 방법이 더 이상 동일하지 않은 이유는 무엇입니까?
제목은 모든 것을 말합니다. 최소 오차와 최대 확률은 모형의 오차가 정규 분포를 따르는 경우 회귀 계수에 대해 동일한 결과를 제공한다는 것을 이해합니다. 그러나 오류가 정상적으로 분포되지 않으면 어떻게됩니까? 두 방법이 더 이상 동일하지 않은 이유는 무엇입니까?
답변:
다변량 가우시안 확률 밀도 분포 변수 , 평균, 의 제곱에 관련 평균과 변수 사이의 유클리드 거리 ( ), 즉 제곱의 합.
동일한 편차를 가정하는 오차에 대해 여러 가우스 분포를 곱하면 제곱합이됩니다.
또는 편리한 로그 형태로 :
따라서 , 제곱의 합을 최소화하기 위해 를 최적화 하는 것은 (log) 가능성을 최대화하는 것과 같습니다 (즉, 다중 가우시안 분포 또는 다변량 가우시안 분포의 곱).
다른 분포에는없는 e x p [ ( x i - μ ) 2 ]의 지수 구조 내 에서이 중첩 된 제곱 차 입니다.
예를 들어 포아송 분포의 경우와 비교
다음을 최소화하면 최대 값을 갖습니다.
다른 짐승입니다.
정규 분포의 이력 (deMoivre가이 분포에 대한 근사치로이 분포에 도달하는 것을 무시 함)은 실제로 MLE을 최소 제곱 법 (메소드 인 최소 제곱 법이 아닌)에 대응시키는 분포의 발견과 같습니다. 정규 분포의 MLE을 표현할 수 있고, 먼저 최소 제곱 법이, 두 번째는 가우시안 분포입니다.
찰스 헨리 데이비스 (Charles Henry Davis)의 번역 (원뿔 부분에서 태양을 중심으로 움직이는 천체의 운동 이론. 부록이있는 가우스의 "이론적 해부"번역) ...
가우스는 다음을 정의합니다.
(나에 의해 이탤릭체 화)
그리고 계속한다 ( 177 pp. 258 ) :
MLE는 정규 분포가 잔존한다는 가정에서 비롯된 것입니다.
참고
확률과 가능성의 개념이 나오는 곳은
구체적인 예 : 간단한 오류 함수 p (1) =. 9, p (-9) = .10을 가정합니다. 우리가 두 점을 취하면 LS는 그 점을 통과 할 것입니다. 반면에 ML은 두 지점이 모두 한 단위가 너무 높다고 가정하므로 단위에서 아래로 이동 한 지점을 통해 선을 그립니다.