다음은 네가티브 릿지에서 일어나는 일을 기하학적으로 보여줍니다.
형식의 추정 고려 손실 함수다음은 와 함께 2 차원 경우에 발생하는 표준 그림입니다 . Zero lambda는 OLS 솔루션에 해당하며, 무한 lambda는 예상 베타를 0으로 축소합니다.
β^λ=(X⊤X+λI)−1X⊤y
λ∈[0,∞)Lλ=∥y−Xβ∥2+λ∥β∥2.
λ∈[0,∞)
이제 일 때 발생하는 상황을 고려하십시오 . 여기서 는 가장 큰 특이 값 입니다. 매우 큰 음수 람다의 경우 는 물론 0에 가깝습니다. 람다 접근하면 , 용어 역이 마이너스 무한대로가는 하나 개의 특이 값을 가지고 있다는 것을 의미 제로에 접근하는 하나 개의 단일 값을 가져옵니다. 이 특이 값은 의 첫 번째 주성분에 해당 하므로 한계 값에서 PC1 방향을 가리키는 얻지 만 절대 값은 무한대로 증가합니다.λ∈(−∞,−s2max)smaxXβ^λ−s2max(X⊤X+λI)Xβ^λ
정말 좋은 점은 동일한 방식으로 같은 그림에 그림을 그릴 수 있다는 것입니다. 베타는 원 이 내부 에서 타원에 닿는 지점에 의해 제공됩니다 .
경우 , 유사한 로직이 OLS 추정기의 반대편에 리지 경로를 계속할 수 있도록 적용된다. 이제 원은 외부로부터 타원 터치. 년 한계는 베타가 PC2 방향에 접근하지만이 스케치와는 거리가 멀다는 것입니다.λ∈(−s2min,0]
범위가의 뭔가 에너지 갭 : 추정량 같은 곡선에없는 라이브가 않습니다.(−s2max,−s2min)
업데이트 : 의견 @MartinL은 대해 의 손실 은 최소는 아니지만 최대를 가지고 있다고 설명합니다. 이 최대 값은 됩니다. 그렇기 때문에 원 / 타원 터치와 동일한 기하학적 구조가 계속 작동합니다. 우리는 여전히 제로 그라데이션 포인트를 찾고 있습니다. 경우 , 손실 최소 가지고 그것은 주어진다 정확하게 정상 같이 건입니다.λ<−s2maxLλβ^λ−s2min<λ≤0Lλβ^λλ>0
그러나 일 때 손실 는 최대 값 또는 최소값이 아닙니다. 는 새들 포인트에 해당합니다. 이것은 "에너지 격차"를 설명합니다.−s2max<λ<−s2minLλβ^λ
자연스럽게 특정 제약 릿지 회귀 발생을 참조 할 때 "단위 분산"리지 회귀 추정기의 한계 . 이것은 화학 계량 학 문헌에서 "연속 회귀"라고 알려진 것과 관련이 있습니다. 연결된 스레드에서 내 대답을 참조하십시오.λ∈(−∞,−s2max)λ→∞
과 완전히 동일하게 처리 할 수 손실 함수를 동일하게 유지하고, 릿지 추정기 최소를 제공.λ∈(−s2min,0]λ>0