답변:
일부 포인터, 특히 5 페이지의 SVM 분류에 대한 실용 가이드를 확인하십시오 .
교차 검증을 사용하여 및 γ 에 대한 "그리드 검색"을 권장합니다 . 다양한 쌍의 ( C , γ ) 값이 시도되고 최고의 교차 검증 정확도를 가진 값이 선택됩니다. 우리의 기하 급수적으로 증가 시퀀스 시도하는 것을 발견 C 와 γ하는 것은 (예를 들어, 좋은 매개 변수를 식별 할 수있는 실제적인 방법이다 C = 2 - (5) , 2 - 3 , ... , 2 15 , γ = 2 - 15 , 2 - (13) , ).
먼저 데이터를 정규화해야하며 가능한 경우 모양에서 더 많은 데이터를 수집하면 문제가 크게 결정되지 않을 수 있습니다.
Chapelle과 Zien 이이 논문 의 섹션 2.3.2를 확인하십시오 . 그들은 RBF 커널의 에 대한 좋은 검색 범위 와 SVM에 대한 C 를 선택하는 좋은 휴리스틱을 가지고 있습니다 . 나는 인용한다
나머지 자유 매개 변수의 좋은 값을 결정하려면 (예 : CV) 올바른 규모로 검색하는 것이 중요합니다. 따라서 올바른 순서의 및 σ에 대한 기본값을 수정합니다 . A의 C - 클래스 문제를 우리가 사용하는 1 / C 분위수 페어 와이즈 거리의 D ρ 나는 J 의 기본으로 모든 데이터 포인트를 σ . C 의 기본값 은 피처 공간에서 의 경험적 분산 s 2 의 역수이며 s 2 = 1 로 계산할 수 있습니다.
) of the default value as search range in a grid-search using cross-validation. That always worked very well for me.
Of course, we @ciri said, normalizing the data etc. is always a good idea.