답변:
통찰력 을 요구하기 때문에 좀 더 수학적인 방법이 아닌 상당히 직관적 인 접근 방식을 사용하겠습니다.
여기 에 내 대답의 개념을 따르면, 우리는 (공식에서) 관측 값 을 추가하여 더미 데이터를 사용하여 능선 회귀를 공식화 할 수 있습니다 . 여기서 , 및 경우 n + j =0입니다. 이 확장 된 데이터 세트에 대한 새 RSS를 작성하면 추가 관측치에 각각 양식의 용어가 추가됩니다 이므로 새 RSS는 원래 입니다.이 새로운 확장 된 데이터 세트에서 RSS를 최소화하는 것은 능선 회귀를 최소화하는 것과 같습니다. 표준.
우리가 왜 능선에 대해 먼저 이야기하고 있는지 (왜 필요한지 제안) 직관적 인 감각을 제공하고 약간의 역사를 다루겠습니다. 첫 번째는 내 대답 에서 조정되었습니다 .
릿지 회귀는 릿지를 "고정"합니다. 릿지를 추가하여 가능성 공간에서 릿지를 멋진 정점으로 만듭니다.
[ 선명한 이미지 ]
이름 뒤의 실제 이야기는 조금 더 복잡합니다. 1959 년에 AE Hoerl [1] 은 반응 표면 방법론에 대한 릿지 분석 을 도입 했으며, 곧 [2] 회귀의 다중 공선 성 ( 'ridge regression')을 다루는 데 적합하게되었다. 예를 들어, [3]의 RW Hoerl의 논의를 참조하십시오. 여기에서 Hoerl이 (RW가 아닌 AE) 응답 표면의 등고선 플롯 사용 *을 설명하여 로컬 최적화를 찾기 위해 어디로 향해야하는지 식별합니다 (여기서 산등성이'). 조건이 잘못된 문제에서는 매우 긴 능선 문제가 발생하고 능선 분석의 통찰력과 방법론은 회귀 분석의 가능성 / RSS와 관련 문제에 적응하여 능선 회귀를 생성합니다.
* 반응 표면 윤곽 플롯의 예 (2 차 반응의 경우)는 여기에서 볼 수 있습니다 (그림 3.9-3.12).
능선 회귀의 필요성에 대한 추가 정보는 위 목록 항목 2의 첫 번째 링크를 참조하십시오.
참고 문헌 :
[1] : Hoerl, AE (1959). 많은 변수 방정식의 최적 솔루션. 화학 공학 진행 , 55 (11) 69-78.
[2] : Hoerl, AE (1962). 능형 분석을 회귀 문제에 적용 화학 공학 진행 , 58 (3) 54-59.
[3] Hoerl, RW (1985). 릿지 분석 25 년 후. 미국 통계 학자 , 39 (3), 186-192
(업데이트 : Glen_b의 답변을 참조하십시오. 이것이 올바른 역사적 이유 는 아닙니다 !)
꽤 친숙해 보일 것입니다.
따라서 평균이 0이고 분산이 두면
: 더 이상이 점으로 정의 된 고유 한 초평면이 없습니다. 우리는 각각 0의 잔차 제곱합을 갖는 다수의 초평면에 맞출 수 있습니다.