폐쇄 형 올가미 솔루션의 파생이 왜 올바르지 않습니까?


28

βlasso=argminβyXβ22+αβ1
βjlasso=sgn(βjLS)(|βjLS|α)+
X

그러나 왜 일반적으로 닫힌 양식 솔루션이 없는지 이해하지 못합니다. 차등을 사용하여 다음을 얻었습니다.

( Xn×p 매트릭스입니다)

= n i = 1 ( y i - X i β ) 2 + α p j = 1 | β j |

f(β)=yXβ22+αβ1
=i=1n(yiXiβ)2+αj=1p|βj|
( XiX 의 i 번째 행 X) f
=i=1nyi22i=1nyiXiβ+i=1nβTXiTXiβ+αj=1p|βj|
fβj=2i=1nyiXij+2i=1nXij2βj+βj(α|βj|)
={2i=1nyiXij+2i=1nXij2βj+α for βj>02i=1nyiXij+2i=1nXij2βjα for βj<0[2i=1nyiXijα,2i=1nyiXij+α] for βj=0
fβj=0 우리 얻을

βj={(2(i=1nyiXij)α)/2i=1nXij2for i=1nyiXij>α(2(i=1nyiXij)+α)/2i=1nXij2for i=1nyiXij<α0 for i=1nyiXij[α,α]

내가 잘못한 곳을 아는 사람이 있습니까?

대답:

행렬로 문제를 작성하면 X ^ TX = I 인 정규 직교 경우에만 닫힌 양식 솔루션이 존재하는 이유를 매우 쉽게 알 수 있습니다 XTX=I.

f(β)=yXβ22+αβ1
=yTy2βTXTy+βTXTXβ+αβ1
f(β)=2XTy+2XTXβ+(α|β1)
(여기서 여러 단계를 밟았습니다. 지금까지 이것은 최소 제곱 솔루션의 파생과 완전히 유사하므로 누락 된 단계를 찾을 수 있습니다.)
fβj=2XjTy+2(XTX)jβ+βj(α|βj|)

함께 fβj=0 우리 얻을

2(XTX)jβ=2XjTyβj(α|βj|)
2(XTX)jjβj=2XjTyβj(α|βj|)2i=1,ijp(XTX)jiβi

우리는 이제 하나의 대한 솔루션 이 다른 모든 의존한다는 것을 알 수 있으므로 여기에서 진행하는 방법이 명확하지 않습니다. 가 정규 직교 이면 경우 닫힌 형식 솔루션이 반드시 존재합니다.βjβijX2(XTX)jβ=2(I)jβ=2βj

그의 답변에 대해 Guðmundur Einarsson에게 감사드립니다. 이번에는 그것이 맞기를 바랍니다 :-)


3
CrossValidated에 오신 것을 환영합니다. 아주 멋진 첫 게시물을 축하합니다 !
S. Kolassa-복원 모니카

답변:


16

이것은 일반적으로 최소 각도 회귀로 수행되며 여기 에서 용지를 찾을 수 있습니다 .

처음에 혼란스러워서 미안하지만, 이것에 대해 또 다른 시도를 할 것입니다.

그래서 기능의 확장 후 당신이 얻을f(β)

f(β)=i=1nyi22i=1nyiXiβ+i=1nβTXiTXiβ+αj=1p|βj|

그런 다음 대한 부분 미분을 계산합니다 . 내 관심사는 1- 노름 이전의 마지막 항, 즉 2 차 항의 부분 도함수를 계산하는 것입니다. 더 자세히 살펴 보자. 우리는 그것을 가지고 있습니다 :βj

Xiβ=βTXiT=(β1Xi1+β2Xi2++βpXip)
따라서 2 차 항을 로 다시 쓸 수 있습니다. 이제 우리는 연쇄 규칙을 사용하여이 wrt 의 미분을 계산할 수 있습니다 .
i=1nβTXiTXiβ=i=1n(Xiβ)2
βj
βji=1n(Xiβ)2=i=1nβj(Xiβ)2=i=1n2(Xiβ)Xij

따라서 각 방정식에 모든 계수 가 있으므로 문제가 쉽게 단순화되지 않습니다 .β

이것은 올가미의 닫힌 양식 솔루션이없는 이유에 대한 귀하의 질문에 대답하지 않습니다. 나중에 무언가를 추가 할 수 있습니다.


1
고마워 실제로 닫힌 양식 솔루션이없는 이유를 알 수 있습니다 (편집 참조).
Norbert

단! 대단한 일 :)
Gumeo
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.