통계 학습 알고리즘을 실행하기 전에 기능 선택 방법 (랜덤 포리스트 기능 중요도 값 또는 일 변량 기능 선택 방법 등)을 사용해야하는 것과 관련하여 한 가지 질문이 있습니다.
우리는 과적 합을 피하기 위해 가중치 벡터에 정규화 페널티를 도입 할 수 있습니다.
따라서 선형 회귀를 원한다면 L2 또는 L1 또는 Elastic net 정규화 매개 변수를 도입 할 수 있습니다. 스파 스 솔루션을 얻기 위해 L1 페널티는 기능 선택에 도움이됩니다.
그런 다음 Lasso?와 같은 L1 정규화 회귀를 실행하기 전에 기능 선택을 수행해야합니다. 기술적으로 Lasso는 L1 페널티로 기능을 줄이는 데 도움을줍니다. 그러면 왜 algo를 실행하기 전에 기능 선택이 필요한가요?
Anova를 수행 한 다음 SVM을 사용하는 것이 SVM 만 사용하는 것보다 더 나은 성능을 제공한다는 연구 기사를 읽었습니다. 이제 질문은 다음과 같습니다. SVM은 본질적으로 L2 규범을 사용하여 정규화를 수행합니다. 마진을 최대화하기 위해 가중치 벡터 표준을 최소화하고 있습니다. 객관적인 기능으로 정규화하고 있습니다. 그런 다음 SVM과 같은 기술 알고리즘은 기능 선택 방법에 대해 신경 쓰지 않아야합니다. 그러나 보고서는 정상적인 SVM이 더 강력 해지기 전에 일 변량 기능 선택을 수행한다고 말합니다.
생각이있는 사람?