탄성 순 회귀 분석에서 람다에 대해 람다가 "최소한의 표준 오차 내에서"λ를 권장하는 이유는 무엇입니까?


23

탄력적 그물 회귀에서 람다의 역할을 이해합니다. 교차 검증 된 오류를 최소화하는 람다의 값 인 lambda.min을 선택하는 이유를 이해할 수 있습니다.

내 질문은 통계 문헌에서 lambda.1se를 사용하는 것이 좋습니다. 즉, CV 오류와 하나의 표준 오류를 최소화하는 lambda의 값 입니까? 나는 공식적인 인용이나 심지어 이것이 종종 가치가있는 이유를 찾지 못하는 것 같습니다. 나는 그것이보다 제한적인 정규화이며 매개 변수를 0으로 더 축소 할 것이라는 것을 이해하지만 lambda.1se가 lambda.min보다 더 나은 선택 인 조건은 항상 확실하지는 않습니다. 누군가 설명 할 수 있습니까?


5
공식적인 참조는 Hastie et al. "통계학 학습의 요소" 61 쪽. 그러나 그들은이 선택에 대해 많은 타당성을 제시하지 않습니다.
Richard Hardy

답변:


22

Friedman, Hastie 및 Tibshirani (2010) 는 통계 학습의 요소를 인용하면서 ,

우리는 종종 최상의 모델을 선택할 때“일 표준 오류”규칙을 사용합니다. 이것은 위험 곡선이 오류로 추정된다는 사실을 인정하므로 파시 모니 측면에서 오류가 발생합니다.

다른 양과 달리 하나의 표준 오류를 사용하는 이유는 표준이기 때문입니다. Krstajic 등 (2014)은 다음과 같이 씁니다 (굵게 강조).

Breiman et al. [25]는 분류 트리 모델에 대해 최적의 트리 크기를 선택하는 경우 최소 교차 검증 오류가있는 트리 크기가 일반적으로 과적 합하는 모델을 생성한다는 것을 발견했습니다. 그러므로 그들의 저서 Breiman et al. [25] 최적의 트리 크기를 선택하기위한 하나의 표준 오류 규칙 (1 SE 규칙)을 정의하고 책 전체에이를 구현합니다. 단일 V- 폴드 교차 검증에 대한 표준 오차를 계산하려면 각 접기에 대해 정확도를 계산해야하며 표준 오차는 각 접기의 V 정확도로부터 계산됩니다. Hastie et al. [4]는 1 SE 규칙을 오류가 최고 모델의 오류보다 하나의 표준 오류 이상인 가장 교묘 한 모델을 선택하는 것으로 정의하고, 일반적인 교차 검증 사용을 위해 1 SE 규칙을 사용하여 여러 곳에서 제안합니다.우리가 동의하는 1 SE 규칙의 요점은 최고의 모델과 정확도가 비슷한 가장 간단한 모델을 선택하는 것 입니다.

하나의 표준 오류는 일반적으로 값 의 범위에 비해 크지 않다는 의미에 기초하여 하나의 표준 오류의 선택은 완전히 휴리스틱 한 것으로 제안 됩니다.λ


1
고맙습니다! 이제 람다의 "표준"선택에 익숙하지 않은 사람들에게 질문이 올 때 마침내 적절한 것을 인용 할 수 있습니다. Krstajic et al과의 연계도 훌륭해 보입니다.
jhersh

그 인용은 단지 "1se가 분류에 최적 인 것으로 밝혀졌다"고 말합니다 . 그러나 질문은 회귀에 대해 물었다 ! 대안이 있습니다. 예를 들어 2se로 돌아 가려고하면 람다가 너무 커서 계수를 너무 많이 줄인다는 문제가 발생합니다. 그러나 원래 모델에서 lambda.1se에서 선택하지 않은 모든 변수를 제외하는 모델을 다시 작성할 수 있습니다.
smci

@smci 어떤 인용? 내가 추출 한 인용문 중 하나에 있지 않으므로 분류뿐만 아니라 1-SE 규칙이 일반적으로 적용 될 수 있습니다.
shadowtalker 2012

6

Breiman et al.의 책 (Krstajic의 다른 답변 인용문에 인용)은 1SE 규칙에서 찾은 가장 오래된 참고 문헌입니다.

이것은 Breiman, Friedman, Stone 및 Olshen의 분류 및 회귀 트리 (1984)입니다. 이들은 3.4.3 절에서이 규칙을 "유도"합니다.

따라서 공식 인용이 필요한 경우 원래 출처 인 것 같습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.