보다 기술적 인 대답은 제한된 최적화 문제를 Lagrange multiplier로 작성할 수 있기 때문입니다. 특히, 제한된 최적화 문제와 관련된 라그랑지안 은 L ( β ) = a r g m i n β 로 주어진다.
L(β)=argminβ⎧⎩⎨∑i=1N(yi−∑j=1pxijβj)2⎫⎭⎬+μ{(1−α)∑j=1p|βj|+α∑j=1pβ2j}
여기서μ는 문제의 제약 조건을 충족시키기 위해 선택된 승수입니다. 따라서이 최적화 문제에 대한 1 차 조건 (좋은 볼록 함수로 작업하기 때문에 충분 함)은 β 와 관련하여 Lagrangian을 차별화 하고 미분을 0으로 설정 함으로써 얻을 수 있습니다 (LASSO 이후 조금 더 미묘한 차이가 있습니다) 부분은 구별 할 수없는 점이 있지만 , 1 차 조건이 여전히 작동하도록 미분을 일반화하는 볼록한 분석 방법 이 있습니다). 이러한 1 차 순서 조건은 기록한 제한되지 않은 문제의 1 차 조건과 동일합니다.
그러나 왜 이러한 최적화 문제로 인해 제한된 최적화 문제의 렌즈 또는 제한되지 않은 문제의 렌즈를 통해 문제에 대해 생각할 수 있는지를 아는 것이 유용하다고 생각합니다. 보다 구체적으로, 다음과 같은 형식의 제한없는 최적화 문제가 있다고 가정합니다.
maxxf(x)+λg(x)
우리는 항상이 최적화를 직접 시도 할 수 있지만 때로는이 문제를 하위 구성 요소로 나누는 것이 합리적 일 수 있습니다 . 특히,
따라서 고정 값은최대엑스에프( X ) + λ g( x ) = 최대티( 최대엑스에프( x ) s . t g ( x ) = t ) + λ t
λ (그리고 최적화 될 함수가 실제로 최적을 달성한다고 가정하면) 외부 최적화 문제를 해결 하는 값 와 연결할 수 있습니다 . 이것은 우리에게 제한되지 않은 최적화 문제에서 제약 문제까지의 일종의 매핑을 제공합니다. 특정 설정에서 모든 것이 순 순 회귀에 적합하게 작동하기 때문에이 매핑은 실제로 일대일이어야하므로 특정 응용 프로그램에 더 유용한 것에 따라이 두 컨텍스트간에 전환 할 수 있으면 유용합니다. 일반적으로 구속 된 문제와 제한되지 않은 문제 사이의 관계는 잘 작동하지 않을 수 있지만 제약 된 문제와 제한되지 않은 문제 사이에서 어느 정도 이동할 수 있는지 생각하는 것이 여전히 유용 할 수 있습니다.티※
편집 : 요청에 따라 능선 회귀 분석에 대한보다 구체적인 분석을 포함시킵니다. 왜냐하면 LASSO 페널티의 미분과 관련된 기술을 다루지 않으면 서 주요 아이디어를 포착하기 때문입니다. 우리는 최적화 문제를 (행렬 표기법으로) 해결하고 있습니다.
a r g m i nβ{ ∑나는 = 1엔와이나는− x티나는β}s . t .| | β| |2≤ M
하자 OLS 솔루션을 수 (즉, 아무런 제약이없는 경우). 그런 다음그렇지 않으면 제약 조건이 바인딩되지 않기 때문에 흥미롭지 않습니다. 이 문제에 대한 Lagrangian은
그러면 미분 하면 첫 번째 주문 조건이 나타납니다.
는 선형 방정식 시스템이므로 해결할 수 있습니다.
βO L S미디엄< ∣∣∣∣βO L S∣∣∣∣L (β) = a r g m i nβ{ ∑나는 = 1엔와이나는− x티나는β} −μ⋅ | | β| |2≤ M
0 = − 2 ( ∑나는 = 1엔와이나는엑스나는+ ( ∑나는 = 1엔엑스나는엑스티나는+ μ I) β)
β^= ( ∑나는 = 1엔엑스나는엑스티나는+ μ I)− 1( ∑나는 = 1엔와이나는엑스나는)
multiplier 선택하십시오 . 그런 다음 제약 조건을 충족시키기 위해 승수를 간단히 선택합니다.μ
⎛⎝( ∑나는 = 1엔엑스나는엑스티나는+ μ I)− 1( ∑나는 = 1엔와이나는엑스나는) ⎞⎠티⎛⎝( ∑나는 = 1엔엑스나는엑스티나는+ μ I)− 1( ∑나는 = 1엔와이나는엑스나는) ⎞⎠= M
은 에서 단조이기 때문에 존재합니다 . 이 방정식은 승수 에서 제약 조건 으로의 명시 적 매핑을 제공합니다 . 와 함께
RHS가 존재하고 때이
매핑은 실제로 매우 직관적 인 것입니다. 봉투 정리는 우리에게 그μμ ∈ ( 0 , ∞ )미디엄∈ ( 0 , ∣∣∣∣βO L S∣∣∣∣)임μ → 0미디엄( μ ) = ∣∣∣∣βO L S∣∣∣∣
임μ → ∞미디엄( μ ) = 0
μ ( M)제약 조건 의 작은 완화로 인해 발생하는 오차의 한계 감소에 해당합니다 . 이것은 이. 구속 조건이 구속력이 없으면 더 이상 이완 할 가치가 없으므로 승수가 사라집니다.미디엄μ → 0미디엄→ | | βO L S| |