βlasso=argminβ∥y−Xβ∥22+α∥β∥1
βlassoj=sgn(βLSj)(|βLSj|−α)+
X
그러나 왜 일반적으로 닫힌 양식 솔루션이 없는지 이해하지 못합니다. 차등을 사용하여 다음을 얻었습니다.
( X 는 n×p 매트릭스입니다)
= n ∑ i = 1 ( y i - X i β ) 2 + α p ∑ j = 1 | β j |
f(β)=∥y−Xβ∥22+α∥β∥1
=∑i=1n(yi−Xiβ)2+α∑j=1p|βj|
(
Xi 는
X 의 i 번째 행
X)
⇒ ∂ f=∑i=1ny2i−2∑i=1nyiXiβ+∑i=1nβTXTiXiβ+α∑j=1p|βj|
⇒∂f∂βj=−2∑i=1nyiXij+2∑i=1nX2ijβj+∂∂βj(α|βj|)
=⎧⎩⎨⎪⎪−2∑ni=1yiXij+2∑ni=1X2ijβj+α for βj>0−2∑ni=1yiXij+2∑ni=1X2ijβj−α for βj<0[−2∑ni=1yiXij−α,−2∑ni=1yiXij+α] for βj=0
와
∂f∂βj=0 우리 얻을
βj=⎧⎩⎨⎪⎪(2(∑ni=1yiXij)−α)/2∑ni=1X2ij(2(∑ni=1yiXij)+α)/2∑ni=1X2ij0for ∑ni=1yiXij>αfor ∑ni=1yiXij<−α for ∑ni=1yiXij∈[−α,α]
내가 잘못한 곳을 아는 사람이 있습니까?
대답:
행렬로 문제를 작성하면 X ^ TX = I 인 정규 직교 경우에만 닫힌 양식 솔루션이 존재하는 이유를 매우 쉽게 알 수 있습니다 XTX=I.
f(β)=∥y−Xβ∥22+α∥β∥1
=yTy−2βTXTy+βTXTXβ+α∥β∥1
⇒∇f(β)=−2XTy+2XTXβ+∇(α|β∥1)
(여기서 여러 단계를 밟았습니다. 지금까지 이것은 최소 제곱 솔루션의 파생과 완전히 유사하므로 누락 된 단계를 찾을 수 있습니다.)
⇒∂f∂βj=−2XTjy+2(XTX)jβ+∂∂βj(α|βj|)
함께 ∂f∂βj=0 우리 얻을
2(XTX)jβ=2XTjy−∂∂βj(α|βj|)
⇔2(XTX)jjβj=2XTjy−∂∂βj(α|βj|)−2∑i=1,i≠jp(XTX)jiβi
우리는 이제 하나의 대한 솔루션 이 다른 모든 의존한다는 것을 알 수 있으므로 여기에서 진행하는 방법이 명확하지 않습니다. 가 정규 직교 이면 경우 닫힌 형식 솔루션이 반드시 존재합니다.βjβi≠jX2(XTX)jβ=2(I)jβ=2βj
그의 답변에 대해 Guðmundur Einarsson에게 감사드립니다. 이번에는 그것이 맞기를 바랍니다 :-)