선형 회귀의 경우 MLE와 최소 제곱의 관계


9

Hastie와 Tibshirani는 그들의 책의 4.3.2 절 에서 선형 회귀 설정에서 최소 제곱 접근은 실제로 최대 가능성의 특별한 경우 라고 언급했습니다 . 이 결과를 어떻게 증명할 수 있습니까?

추신 : 수학적 세부 사항이 없습니다.


2
특별한 경우는 아닙니다. 오류 분포가 정상일 때와 동일합니다.
잔 시옹

답변:


13

선형 회귀 모형

Y=Xβ+ϵ , 여기서ϵN(0,Iσ2)

YRn , 및XRn×pβ아르 자형

모델 오류 (잔여)는 입니다. 우리의 목표는 규범을이 오차의 제곱으로 최소화하는 의 벡터를 찾는 것입니다 .ϵ=와이엑스ββ2

최소 제곱

각 가 차원 인 데이터 이 주어지면 다음을 찾습니다.(엑스1,와이1),...,(엑스,와이)엑스나는

β^에스=아르 민β||ϵ||2=아르 민β||와이엑스β||2=아르 민β나는=1(와이나는엑스나는β)2

최대 가능성

위의 모델을 사용하여 매개 변수 주어진 데이터의 가능성을 다음과 같이 설정할 수 있습니다 .β

(와이|엑스,β)=나는=1에프(와이나는|엑스나는,β)

여기서 는 평균이 0이고 분산이 정규 분포의 pdf입니다 . 연결하기 :에프(와이나는|엑스나는,β)σ2

(와이|엑스,β)=나는=112πσ2이자형(와이나는엑스나는β)22σ2

이제 일반적으로 가능성을 다룰 때 계속하기 전에 수학적으로 로그를 가져가는 것이 더 쉽습니다 (제품이 합계가되고 지수가 사라짐). 그렇게하겠습니다.

로그(와이|엑스,β)=나는=1로그(12πσ2)(와이나는엑스나는β)22σ2

최대 우도 추정치를 원하므로 와 관련하여 위의 최대 방정식을 찾고 싶습니다 . 첫 번째 용어는 추정에 영향을 미치지 않으므로 무시할 수 있습니다.ββ

β^미디엄이자형=argmaxβ나는=1(와이나는엑스나는β)22σ2

분모는 대한 상수입니다 . 마지막으로, 합계 앞에 음의 부호가 있습니다. 따라서 음수의 최대 값을 찾는 것은 음수가없는 최소값을 찾는 것과 같습니다. 다시 말해:β

β^미디엄이자형=아르 민β나는=1(와이나는엑스나는β)2=β^에스

이것이 작동하기 위해서는 특정 모델 가정 (에러 항의 정규성, 평균 0, 상수 분산)을 만들어야한다는 것을 상기하십시오. 특정 조건에서 최소 제곱은 MLE과 같습니다. 자세한 내용은 여기여기 를 참조 하십시오 .

완전성을 위해 솔루션은 다음과 같이 작성할 수 있습니다.

β=(엑스엑스)1엑스와이
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.