선형 회귀 분석에서 정규화가 매개 변수 값에도 페널티를주는 이유는 무엇입니까?


9

현재 능선 회귀를 배우고 더 복잡한 모델의 처벌 (또는 더 복잡한 모델의 정의)에 대해 약간 혼란 스러웠습니다.

내가 이해 한 바에 따르면, 모델의 복잡성이 다항식과 반드시 ​​관련이있는 것은 아닙니다. 따라서 는 보다 더 복잡한 모델입니다.

2++4엑스2+5엑스+6엑스4
5엑스5

그리고 정규화의 포인트는 모델 복잡성을 낮게 유지하는 것이므로 예를 들어 5 차 다항식

에프(엑스;)=0+1엑스+2엑스2+엑스+4엑스4+5엑스5

매개 변수가 0 일수록 더 좋습니다.

그러나 내가 이해하지 못하는 것은 같은 순서 다항식이라면 왜 더 낮은 매개 변수 값이 덜 페널티를 받습니까? 왜 :

2+5엑스+엑스
은보다 복잡한 모델이 아닙니다.

433+342엑스+323엑스
둘 다 동일한 다항식 순서이며 매개 변수 값은 단순히 데이터에 따라 다릅니다.

감사합니다!

답변:


10

단순히 데이터에 의존하는 매개 변수 값

이것이 귀하의 질문의 핵심 부분입니다. 이것은 당신이 혼란스러워하는 곳입니다.

예, 매개 변수 값은 데이터에 따라 다릅니다. 그러나 모델에 적합 하면 데이터가 고정 됩니다. 다시 말해, 우리 는 관측치에 조건부 로 모델을 맞 춥니 다 . 다른 데이터 세트에 맞는 다른 모델의 복잡성을 비교하는 것은 이치에 맞지 않습니다 .

고정 데이터 셋의 맥락에서 모델

2+5엑스+엑스

실제로 가장 단순한 모델, 즉 평평한 제로 모델에 더 가깝습니다.

433+342엑스+323엑스,

이것은 관측 규모에 관계없이 유지됩니다.

또한 인터셉트 ( 예 : 및 )는 예를 들어 대부분의 올가미 공식에서 종종 불이익을받지 않습니다. 일반적으로 관측의 전체 평균을 자유롭게 포착 할 수 있도록하는 것이 좋기 때문입니다. 다시 말해, 우리는 모델을 완전한 0 모델이 아닌 관측치의 평균으로 축소합니다 (0은 종종 임의적 임). 이런 의미에서 평평한 와 평평한 모델은 똑같이 복잡한 것으로 간주됩니다.24332433


1
더 작은 크기의 계수는 더 높은 계수보다 평평한 영에서 멀어 집니까? 그것이 오타입니까, 아니면 더 멀리 떨어져있는 모델이 더 가까이있는 모델만큼 불이익을받지 않는 이유를 이해하고 있습니까?
RM

죄송합니다. 오타였습니다. 편집하겠습니다. 이것을 지적 해 주셔서 감사합니다!
Stephan Kolassa
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.