이것은 Karush–Kuhn–Tucker 조건을 통한 상당히 경제적 인 접근을 포함하여 여러 가지 방법으로 공격 할 수 있습니다 .
아래는 매우 기본적인 대안 인수입니다.
직교 설계를위한 최소 제곱 솔루션
가 직교 열로 구성되어 있다고 가정합니다 . 그런 다음 최소 제곱 솔루션은
X
β^LS=(XTX)−1XTy=XTy.
동등한 문제
라그랑지안 양식을 통해 질문에서 고려되는 것과 동등한 문제가
minβ12∥y−Xβ∥22+γ∥β∥1.
우리가 얻을 첫 번째 항을 확장 이후 어떤을 포함하지 않는 관심있는 변수 중 하나를 버리고
12yTy−yTXβ+12βTβyTy
minβ(−yTXβ+12∥β∥2)+γ∥β∥1.
것을주의 , 이전 문제로 다시 쓸 수
β^LS=XTy
minβ∑i=1p−β^LSiβi+12β2i+γ|βi|.
우리의 목적 함수는 이제 각각의 목표 변수 해당하는 목표의 합계 이므로 개별적으로 해결할 수 있습니다.βi
전체는 부분의 합과 같습니다
특정 수정하십시오 . 그런 다음
i
Li=−β^LSiβi+12β2i+γ|βi|.
경우 , 우리는이 있어야합니다 , 그렇지 않으면 때문에 우리가 그 기호를 뒤집어 목적 함수에 대한 낮은 값을 얻을 수 있습니다. 마찬가지로 이면 선택해야합니다 .β^LSi>0βi≥0β^LSi<0βi≤0
사례 1 : . 이후 ,
과 관련하여이 미분 및 0과 동일하게 설정 , 우리는 습니다. 오른쪽이 음수가 아닌 경우에만 가능합니다.이 경우 실제 해결책은
β^LSi>0βi≥0
Li=−β^LSiβi+12β2i+γβi,
βiβi=β^LSi−γβ^lassoi=(β^LSi−γ)+=sgn(β^LSi)(|β^LSi|−γ)+.
사례 2 : . 이것은 이 있어야 함을 의미 하므로
관련하여 차별화 0으로 동일하게 설정, 우리가 얻을 . 그러나, 다시이 가능 보장하기 위해, 우리가 필요로하는 취함으로써 달성되는,
β^LSi≤0βi≤0
Li=−β^LSiβi+12β2i−γβi.
βiβi=β^LSi+γ=sgn(β^LSi)(|β^LSi|−γ)βi≤0β^lassoi=sgn(β^LSi)(|β^LSi|−γ)+.
두 경우 모두 원하는 양식을 얻었으므로 완료되었습니다.
최종 비고
같은 점에 유의 다음의 각을 증가,반드시 감소하므로 합니다. 때 , 우리는 들어, OLS 솔루션을 복구하고,모든 대해 을 얻습니다 .γ|β^lassoi|∥β^lasso∥1γ=0γ>maxi|β^LSi|β^lassoi=0i