정규화를 수행하는 방법에는 , L 1 및 L 2 규범 기반 정규화 와 같은 많은 방법이 있습니다 . Friedman Hastie & Tibsharani 에 따르면 , 최고의 정규화 기는 문제, 즉 실제 목표 함수의 특성, 사용 된 특정 기준, 신호 대 잡음비 및 샘플 크기에 따라 달라집니다.
다양한 정규화 방법의 방법과 성능을 비교 한 경험적 연구가 있습니까?
정규화를 수행하는 방법에는 , L 1 및 L 2 규범 기반 정규화 와 같은 많은 방법이 있습니다 . Friedman Hastie & Tibsharani 에 따르면 , 최고의 정규화 기는 문제, 즉 실제 목표 함수의 특성, 사용 된 특정 기준, 신호 대 잡음비 및 샘플 크기에 따라 달라집니다.
다양한 정규화 방법의 방법과 성능을 비교 한 경험적 연구가 있습니까?
답변:
페널티 선형 모델을 고려하십시오.
패널티는 매우 사용되지 않고 수시로 교체된다 L 1 수학적으로보다 유연 규범.
정규화는 스파 스 모델을 구축 할 수있는 속성이 있습니다. 즉, 회귀 계수가 0이 아닌 변수는 거의 없습니다. 특히 변수가 출력 변수에 실제로 영향을 미치는 것으로 가정하는 경우에 사용됩니다. 상관 관계가 매우 큰 변수가 있으면 이들 중 하나만 0이 아닌 계수로 선택됩니다.
페널티는 값 추가하는 경우처럼 λ을 입력 행렬의 대각선. 예를 들어 변수 수가 샘플 수보다 큰 상황에서 사용할 수 있습니다. 정사각 행렬을 얻기 위해. 으로 L 2 규범 페널티 모든 변수는 비 제로 회귀 계수를 갖는다.
@Donbeo의 답변에 몇 가지 추가 사항
1) L0 규범은 진정한 의미의 규범이 아닙니다. 벡터에서 0이 아닌 항목의 수입니다. 이 규범은 분명히 볼록한 규범이 아니며 진정한 의미의 규범이 아닙니다. 따라서 L0 'norm'과 같은 용어가 표시 될 수 있습니다. 조합 문제가되어 NP가 어렵다.
2) L1 규범은 성긴 솔루션을 제공합니다 (LASSO 참조). Candes, Donoho 등의 주요 결과에 따르면 진정한 솔루션이 실제로 드문 경우 L1 처벌 방법이 복구됩니다. 기본 솔루션이 희박하지 않은 경우 p >> n 인 경우 기본 솔루션을 얻지 못합니다. 올가미가 일관성이 있음을 보여주는 좋은 결과가 있습니다.
3) L2와 L1에 불이익을주는 솔루션을 결합한 Zhou와 Hastie의 Elastic net과 같은 방법이 있습니다.