SVM을 사용할 때는 커널을 선택해야합니다.
커널을 선택하는 방법이 궁금합니다. 커널 선택에 대한 기준이 있습니까?
SVM을 사용할 때는 커널을 선택해야합니다.
커널을 선택하는 방법이 궁금합니다. 커널 선택에 대한 기준이 있습니까?
답변:
커널은 사실상 유사성 측정법이므로 Robin (+1)에서 제안한대로 불변에 대한 사전 지식에 따라 커널을 선택하는 것이 좋습니다.
전문가의 지식이 없으면 Radial Basis Function 커널은 기본 커널을 양호하게 만듭니다 (한 번 설정하면 비선형 모델이 필요한 문제임).
교차 검증 기반 모델 선택을 최적화하여 (또는 반경 여백 또는 스팬 경계를 사용하여) 커널 및 커널 / 정규화 매개 변수 선택을 자동화 할 수 있습니다. 가장 간단한 방법은 Nelder-Mead 심플 렉스 방법을 사용하여 연속 모델 선택 기준을 최소화하는 것입니다.이 방법은 기울기 계산이 필요하지 않으며 상당한 수의 하이퍼 파라미터에 적합합니다. 튜닝 할 하이퍼 파라미터가 몇 개 이상인 경우 모델 선택 기준의 변동으로 인해 자동화 된 모델 선택으로 인해 과도한 피팅이 발생할 수 있습니다. 그래디언트 기반 최적화를 사용할 수 있지만 성능 향상은 일반적으로 코딩 노력에 가치가 없습니다.
커널과 커널 / 정규화 매개 변수의 자동 선택은 까다로운 문제입니다 . 모델 선택 기준 (일반적으로 교차 유효성 검사 기반)을 과도하게 맞추는 것이 매우 쉽고 처음 시작한 것보다 더 나쁜 모델로 끝날 수 있습니다. 자동화 된 모델 선택은 또한 성능 평가를 편향시킬 수 있으므로 성능 평가가 모델을 맞추는 전체 프로세스 (훈련 및 모델 선택)를 평가하는지 확인하십시오.
GC Cawley 및 NLC Talbot, 하이퍼 파라미터의 베이지안 정규화를 통해 모델 선택에서 과적 합 방지, Journal of Machine Learning Research, 8 권, 841-861 페이지, 2007 년 4 월. (pdf)
과
GC Cawley 및 NLC Talbot, 성능 평가에서 모델 선택 및 후속 선택 바이어스에 과적 합, Journal of Machine Learning Research, vol. 11, pp. 2079-2107, 2010 년 7 월. (pdf)
최선의 방법이 확실하지 않은 경우 자동 선택 기술 (예 : 교차 검증, ...)을 사용할 수 있습니다. 이 경우 다른 커널로 얻은 분류기 (문제가 분류 인 경우) 의 조합 을 사용할 수도 있습니다 .
그러나 커널 작업의 "이점"은 일반적인 "유클리드"지오메트리를 자신의 문제에 맞도록 변경하는 것입니다. 또한 문제에 대한 커널의 관심사가 무엇인지, 문제 의 기하학적 구조 가 무엇인지 이해하려고 노력해야합니다 . 여기에는 다음이 포함될 수 있습니다.
나는 항상 SVM에 대한 모든 하이퍼 파라미터 선택이 그리드 검색과 함께 교차 검증을 통해 수행된다는 느낌을 가지고 있습니다.