이 방법론은 좌표 하강을 통한 일반화 된 선형 모델 에 대한 glmnet 논문 정규화 경로에 설명되어 있습니다. 여기서의 방법론은 과 정규화 의 일반적인 경우를위한 것이지만 LASSO ( 만)에도 적용되어야합니다 .L 2 L 1엘1엘2엘1
최대 대한 솔루션 은 섹션 2.5에 나와 있습니다. λ
때 , 우리는에서 볼 (5) 그 제로 남아있을 것입니다 경우 입니다. 따라서 ~ β j1β~= 0β~제이1엔| ⟨ X제이, y⟩ | < λ α엔α λ미디엄X를= 최대엘| ⟨ X엘,y⟩ |
즉, 베타에 대한 업데이트 규칙은 위에서 결정된대로 대해 모든 매개 변수 추정값을 0으로 .λ > λ해요 X를
의 결정과 그리드 포인트의 수는 덜 원칙적으로 보입니다. glmnet에서 를 설정 한 다음 로그 스케일에서 동일 간격으로 점 그리드를 선택합니다 .λ해요 난 Nλ해요 난 N= 0.001 * λ해요 X를100
이것은 실제로 glmnet을 광범위하게 사용할 때이 그리드가 너무 거칠다는 것을 결코 발견하지 못했습니다.
LASSO ( )에서는 LARS 방법이 다양한 예측 변수가 모형에 들어갈 때 정확한 계산을 제공하기 때문에 상황이 더 잘 작동 합니다. 진정한 LARS는 대한 그리드 검색을 수행하지 않고 계수의 솔루션 경로에 대한 정확한 표현을 생성합니다.
다음 은 두 예측 변수 사례에서 계수 경로의 정확한 계산에 대한 자세한 내용입니다.엘1λ
비선형 모델 (예 : 로지스틱, 포아송)의 경우가 더 어렵습니다. 높은 수준에서, 손실 함수에 대한 2 차 근사값은 초기 매개 변수 에서 얻은 다음 위의 계산을 사용하여 를 결정 합니다. 이 경우 정규화 만 제공되는 경우에도 매개 변수 경로를 정확하게 계산할 수 없으므로 그리드 검색이 유일한 옵션입니다.β= 0λ해요 X를엘1
샘플 무게는 상황을 복잡하게 만들고, 내부 제품은 가중 내부 제품으로 적절한 곳에 교체해야합니다.