올가미 패널티가 이전의 이중 지수 (Laplace)에 해당하는 이유는 무엇입니까?


27

회귀 모수 벡터 대한 올가미 추정치 가 각 B i에 대한 이전 분포 가 이중 지수 분포 (라플라스 분포라고도 함) 인 의 사후 모드와 같다는 많은 참고 문헌을 읽었습니다 .나는

나는 이것을 증명하려고 노력했다. 누군가가 세부 사항을 살릴 수 있습니까?


@ user777 나는 오늘 그 책을 훑어보고 있었다. 관련성이 없습니다.
Wintermute

답변:


30

단순하자 그냥 변수의 하나의 관찰을 고려할 것를 들어 와이 그러한를

와이|μ,σ2(μ,σ2),

μ라플라스(λ) 및 부적절한 선행 f(σ)1σ>0 .

그런 다음 의 접합 밀도는 f ( Y , μ , σ 2 | λ ) 1에Y,μ,σ2 비례합니다

f(Y,μ,σ2|λ)1σexp((yμ)2σ2)×2λeλ|μ|.

포함하지 않는 조건 로그를 취하고 폐기 , 로그 (F)을 ( Y는 , μ는 , σ 2 ) = - 1μ

로그에프(와이,μ,σ2)=1σ2와이μ22λ|μ|.(1)

따라서 (1)의 최대 값은 MAP 추정치이며 실제로 다시 매개 변수화 한 후 올가미 문제 입니다. λ~=λσ2

회귀 연장은 분명하다 - 대체 X β 정상 확률, 그리고 이전에 설정된 β는 독립적 라플라스의 순서로 ( λ ) 분포.μ엑스ββ(λ)


25

이것은 LASSO가 최적화하고있는 수량을 검사함으로써 분명합니다.

β나는τ

(β|τ)이자형12τ나는|β나는|

와이이드(엑스β,σ2)

에프(와이|엑스,β,σ2)(σ2)/2특급(12σ2(와이엑스β)(와이엑스β))

이제 후부의 로그를 두 배 빼면 형태가됩니다

케이(σ2,τ,,)+ 1σ2(와이엑스β)(와이엑스β)+1τ나는|β나는|

λ=σ2/τ2로그

케이(σ2,λ,,)+ 1σ2[(와이엑스β)(와이엑스β)+λ나는|β나는|]

β

에스=(와이엑스β)(와이엑스β)+λ나는|β나는|

β

σ2

β


1
λβ1λ|μ|μ=엑스β

2
β0엑스β
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.