와 LASSO 관계


10

LASSO 회귀에 대한 나의 이해는 최소화 문제를 해결하기 위해 회귀 계수가 선택된다는 것입니다.

minβyXβ22 s.t.β1t

실제로 이것은 Lagrange multiplier를 사용하여 수행되므로 문제를 해결할 수 있습니다.

minβyXβ22+λβ1

λt 의 관계는 무엇입니까 t? 위키피디아는 "데이터 의존적"이라고 말하면서 도움이되지 않습니다.

왜 신경 쓰나요? 먼저 지적 호기심. 그러나 교차 검증으로 \ lambda 를 선택했을 때의 결과에 대해서도 우려하고 λ있습니다.

특히, n- 겹 교차 검증을 수행하는 경우 n 개의 다른 모델을 n 개의 다른 학습 데이터 파티션에 맞 춥니 다. 그런 다음 주어진 \ lambda 에 대해 사용되지 않은 데이터에 대한 각 모델의 정확도를 비교합니다 λ. 그러나 동일한 \ lambda 는 데이터의 다른 하위 집합에 대해 λ다른 제약 조건 ( t )을 의미합니다 (즉, t=f(λ) 는 "data dependent").

교차 검증 문제 가 최고의 바이어스 정확도 트레이드 오프를 제공하는 t 를 찾기 위해 실제로 해결하고 싶지 t않습니까?

각 교차 검증 분할 및 에 대해 을 계산 하고 결과 분포를 보면 효과의 크기를 대략적으로 알 수 있습니다 . 경우에 따라 암시 적 제약 조건 ( )은 교차 검증 서브 세트에서 실질적으로 조용히 변할 수 있습니다. 여기서 실질적으로 나는 의 변동 계수를 의미한다 . λ t t > > 0β1λtt>>0


5
설명되지 않은 downvote를 취소하기 위해 upvoting. 질문은 내 전문 지식과는 거리가 멀지 만 합리적으로 공식화 된 것 같습니다.
mkt-Reinstate Monica

답변:


2

이것은 능선 회귀에 대한 표준 솔루션입니다 .

β=(XX+λI)1Xy

우리는 또한 알고 이므로β=t

(XX+λI)1Xy=t
.

해결하기 쉽지 않습니다 .λ

최선의 방법은 당신이하고있는 일을 계속하는 것입니다 : 여러 값에 걸쳐 동일한 하위 샘플 데이터에서 를 계산 하십시오 .tλ

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.