릿지 회귀는 계수 크기에 페널티를 부과하여 선형 회귀를 정규화합니다. 따라서 계수는 0과 서로를 향해 줄어 듭니다. 그러나 이런 일이 발생하고 독립 변수의 배율이 같지 않으면 축소가 불공평합니다. 스케일이 지정된 항이 모든 계수의 제곱의 합이므로 스케일이 다른 두 개의 독립 변수가 처벌 된 항에 다른 기여를합니다. 이러한 종류의 문제를 피하기 위해 종종 독립 변수는 분산 1을 갖기 위해 중심에 맞춰지고 크기가 조정됩니다.
[나중에 댓글을 달려면 수정하세요]
H 예 I g시간 t
람다에 대한 벌칙은 주어진 상수보다 작거나 같은 제곱 계수의 합에 대한 제곱 손실 함수를 표현하는 것과 동일합니다. 즉, 람다가 클수록 계수의 제곱합에 많은 공간을 제공하고 람다를 낮추면 더 작은 공간을 의미합니다. 더 크거나 작은 공간은 계수의 더 크거나 작은 절대 값을 의미합니다.
표준화를 사용하지 않으면 모형에 적합하기 위해 계수의 절대 값이 크게 필요할 수 있습니다. 물론 모델에서 변수의 역할로 인해 자연스럽게 큰 계수 값을 가질 수 있습니다. 내가 말하고있는 것은이 값이 스케일링되지 않기 때문에 인위적으로 팽창 된 값을 가질 수 있다는 것입니다. 따라서 스케일링은 또한 큰 계수 값의 필요성을 줄입니다. 따라서, 람다의 최적 값은 일반적으로 더 작으며, 이는 계수의 제곱 값의 작은 합에 해당한다.