답변:
패널티를 추가하여 손실 기능을 수정하면 충분합니다. 행렬 용어에서 초기 2 차 손실 함수는 (Y-X \ beta) ^ {T} (YX \ beta) + \ lambda \ beta ^ T \ beta가됩니다. \ beta
우리가 알고있는에하자 빌드 입니다 그 때마다 모델 매트릭스는 , 응답을 - 벡터입니다 , 및 매개 변수 - 벡터는 , 목적 함수
가 정규 방정식을 풀면 ( 잔차 제곱의 합) 최소화됩니다
릿지 회귀는 목적 함수에 다른 용어를 추가합니다 (일반적으로 모든 변수를 공통 기반으로 배치하기 위해 모든 변수를 표준화 한 후).
음이 아닌 상수 입니다. 잔차 제곱의 합에 계수 자체의 제곱 합의 배수를 곱한 값입니다 (전역 최소값을 가짐). 이므로 양의 제곱근 있습니다.
항등 행렬 대한 곱에 대응하는 행으로 확장 된 행렬 고려하십시오 .
벡터 가 마지막에 0으로 로 유사하게 확장 되면 목적 함수의 행렬 곱은 형식의 더 합니다. 원래 목표에. 따라서
왼손 표현의 형태에서 법선 방정식은 다음과 같습니다.
의 끝에 0을 인접 시켰으므로 오른쪽은 . 왼쪽의 은 원래 추가됩니다 . 따라서 새로운 정규 방정식은 다음과 같이 단순화됩니다.
개념적으로 경제적 일뿐만 아니라이 결과를 도출하기 위해 새로운 조작이 필요 하지 않고 계산 상 경제적입니다. 보통 최소 제곱을 수행하는 소프트웨어도 아무런 변화없이 능선 회귀를 수행합니다. 그럼에도 불구하고 의 특수 구조를 활용하여 간격이 조밀 한 간격으로 결과를 효율적으로 얻을 수 있기 때문에 이러한 목적으로 설계된 소프트웨어를 사용하면 큰 문제에서 도움이 될 수 있습니다. 와 함께 )
사물을 보는 이런 방식의 또 다른 아름다움은 그것이 능선 회귀를 이해하는 데 도움이 될 수 있다는 것 입니다. 회귀를 실제로 이해하려면 거의 항상 그것을 기하학적으로 생각하면 도움이됩니다. 의 열 은 차원 의 실제 벡터 공간에서 벡터를 구성 합니다 . 인접 바이 에 그들을 연장하여, 에 -vectors -vectors을 우리가 매립되어 보다 큰 공간에 를 포함하여 "상상적인"상호 직교 방향. 의 첫 번째 열는 크기 의 작은 가상의 구성 요소가 주어 지므로이를 확장하여 원래 열에 의해 생성 된 공간 밖으로 이동 시킵니다. 두 번째, 세 번째, ..., 열 마찬가지로 길어 동일한 량만큼 원래의 공간이 이동 - 다른 새로운 방향 그러나 모든. 결과적으로 원래 열에있는 공선 성이 즉시 해결됩니다. 또한, 더 큰 가 될수록, 이들 새로운 벡터는 개별 더 접근한다상상의 방향 : 점점 더 정규직이됩니다. 결과적으로 정규 방정식의 해는 즉시 가능해지며, 가 에서 증가함에 따라 수치 적으로 빠르게 안정됩니다 .
프로세스에 대한이 설명은 Ridge Regression이 처리하도록 설계된 문제를 해결하기위한 몇 가지 참신하고 창의적인 접근법을 제안 합니다. 예를 들어, 어떠한 수단을 사용하여 (예를 들면 그들의 1980 책에 Belsley, 쿠와 Welsch 설명 분산 분해로 회귀 진단 , 3 장), 당신은 거의 동일 선상 열 하위 그룹 식별 할 수 있습니다 여기서 각각의 하위 그룹을 다른 것과 거의 직교합니다. 당신은 많은에 행으로 인접하다 필요 (과에 제로 거리의 형제 자매에서 그룹의 각 요소를 전치에 대해 하나의 새로운 "가상의"치수를 전용으로) 가장 큰 그룹의 요소가있는 한을 : 당신이 필요하지 않은 상상을 이를 수행하기위한 차원.
나는 최근에 P-Splines의 맥락에서 같은 질문에 걸려 넘어졌으며 개념이 동일하므로 능선 추정기의 도출에 대해 더 자세한 답변을하고 싶습니다.
마지막 소환장에서의 처벌 기간에 따라 기존 OLS 기준 기능과 다른 처벌 기준 기능으로 시작합니다.
어디
이 기준을 행렬 표기법으로 다시 작성하고 더 세분화 할 수 있습니다.
와 항등 행렬 인
이제 기준을 최소화 하는 를 검색합니다 . 그중에서도 행렬 분화 규칙 를 사용할 수 있습니다. 여기에 .
주어진 답변에서 누락 된 몇 가지 중요한 사항이 있습니다.
용 용액 : 1 차 필요 조건에서 파생 되는 수율 . 그러나 이것으로 충분합니까? 즉, 가 볼록한 경우에만 솔루션이 최소화됩니다 . 이것은 사실로 보일 수 있습니다.
문제를 보는 또 다른 방법은 와 는 제한되었습니다 . OLS는 일반 최소 제곱을 나타냅니다. 이러한 관점에서 는 볼록 함수 제한된 볼록 목적 함수 의 전역 최소값을 찾는 데 사용되는 Lagrangian 함수 .
이러한 요점과 의 파생에 대한 자세한 설명은 다음의 훌륭한 강의 노트에서 찾을 수 있습니다. http://math.bu.edu/people/cgineste/classes/ma575/p/w14_1.pdf