답변:
기능 엔지니어링 으로 기능 선택 을 의미한다고 가정합니다 . 내가 일반적으로 따르고 일부 사람들이하는 과정은
기능에서 RandomForest, Gradient Boosted Trees, Neutral Networks 또는 SVM과 같은 고성능 알고리즘을 사용하십시오.
2.1 작은 범위의 파라미터에서 그리드 검색과 같은 간단한 파라미터 튜닝
2 단계의 결과가 만족스럽지 않은 경우 1 단계로 돌아가서 더 많은 기능을 생성하거나 중복 기능을 제거하고 최상의 기능을 유지하면 사람들은 일반적으로이 기능 선택을 호출합니다 . 새로운 기능에 대한 아이디어가 부족하면 더 많은 알고리즘을 시도하십시오.
결과가 괜찮거나 원하는 결과에 가깝다면 3 단계로 이동하십시오.
이 작업을 수행하는 이유는 분류가 모든 기능 공학 에 관한 것이며 Computer Vision과 같은 특정 문제에 맞게 사용자 지정된 딥 러닝과 같은 믿을 수없는 강력한 분류기를 모르는 경우입니다. 좋은 기능을 생성하는 것이 핵심입니다. 분류자를 선택하는 것은 중요하지만 중요하지는 않습니다. 위에서 언급 한 모든 분류기는 성능면에서 상당히 비교할 수 있으며 대부분의 경우 최상의 분류 기준은 그중 하나입니다.
매개 변수 조정은 성능을 향상시킬 수 있으며 경우에 따라 상당히 많은 경우가 있습니다. 그러나 좋은 기능이 없으면 튜닝은 큰 도움이되지 않습니다. 항상 매개 변수 조정 시간이 있습니다. 또한 매개 변수를 광범위하게 조정하지 않아도 새로운 기능을 발견하고 모든 것을 다시 실행할 수 있습니다.
나는 이미 비슷한 질문에 대답 했다 . 과정은 다음과 같습니다.
항상 모델을 선택하기 전에 형상 엔지니어링을 시도하고 수행하십시오. 그런 다음 최상의 기능 (또는 문제 / 종속 변수에 더 영향을주는 기능)에 따라 모델을 선택하십시오.