회귀 분석에서 데이터 센터링 및 표준화 필요


16

일부 정규화와 선형 회귀를 고려 : 예 찾기 것을 최소화 | | A x b | | 2 + λ | | x | | 1x||Axb||2+λ||x||1

일반적으로 A의 열은 평균이 0이고 단위 규범을 갖도록 표준화되고 는 평균이 0이되도록 중앙에 배치됩니다. 표준화 및 센터링 사유에 대한 나의 이해가 올바른지 확인하고 싶습니다.b

b 의 열의 수단을 0으로 만들면 더 이상 절편이 필요하지 않습니다. 그렇지 않으면 목표는 | | A x x 0 1 b | | 2 + λ | | x | | 1 . A의 열의 규범을 1과 동일하게함으로써 A의 한 열이 매우 높은 규범을 가지기 때문에 x의 계수가 낮아서 해당 열이 잘못 결론을 내릴 수 있습니다. A는 x를 잘 설명하지 못한다 .Ab||Axx01b||2+λ||x||1xx

이 추론은 정확히 엄격하지는 않지만 직관적으로 생각하는 올바른 방법입니까?

답변:


14

b 의 열 평균을 0으로 만드는 것이 맞습니다 .Ab

그러나 의 열 규범을 조정하는 경우 표준 A로 시작하고 x의 모든 요소 가 대략 같은 크기 인 경우 어떻게 될지 고려 하십시오. 그리고 우리에게, 말에 의한 곱셈 한 열하자 (10) - (6) . 정규화되지 않은 회귀에서 x 의 해당 원소 는 10 6 배 증가합니다 . 정규화 기간에 어떤 일이 발생하는지 봅니까? 정규화는 모든 실제 목적을 위해 하나의 계수에만 적용됩니다. AAx106x106

의 열을 표준화하여 직관적으로 작성하여 모두 같은 규모로 만듭니다. 결과적으로, x 의 원소의 크기의 차이 는 설명 함수 ( A x ) 의 "가발 성"과 직접적으로 관련되어있다 . 그것없이, 예를 들어, 0.1 대 10.0의 계수 값은 A 에 대한 지식이없는 경우 , 어떤 계수가 A x 의 "가발 성 (wiggliness)"에 가장 크게 기여했는지에 대해 아무 것도 알려주지 않을 것입니다 . ( A x 와 같은 선형 함수의 경우 "wiggliness"는 0에서의 편차와 관련이 있습니다.)AxAxAAxAx

설명으로 돌아 가기 위해 한 열이 매우 높은 규범을 가지고 있고 어떤 이유로 x 에서 낮은 계수를 얻는 다면 A 의 열이 x를 잘 설명하지 못한다고 결론을 내릴 수 없습니다 . Ax 를 전혀 "설명"하지 않습니다 . AxAxAx


당신은 $x$ does not ''explain'' $A$ well의미 x does not ''explain'' $A$ at all합니까? 는 데이터이고 x 는 모델입니다. Ax
user3813057

@ user3813057-이것은 정규화에 대한 질문이며 설명력과는 아무런 관련이 없습니다. 는 더 일반적으로 β 로 표시되고 , A 는 더 일반적으로 X 로 표시 되며, b 는 더 일반적으로 y로 표시 됩니다. xA 를 전혀 설명하지 않습니다 . xβAXbyxA
jbowman
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.