다음과 같은 이론적 지침을 제안합니다. Gaussian RBF 커널을 사용하는 경우 분리 표면은 각지지 벡터를 중심으로 한 종 모양 표면의 조합을 기반으로합니다. 각 종 모양 표면의 너비는 반비례 합니다. 이 너비가 데이터의 최소 페어 단위 거리보다 작 으면 본질적으로 과적 합입니다. 이 너비가 데이터의 최대 쌍 단위 거리보다 크면 모든 점이 하나의 클래스에 속하며 성능도 좋지 않습니다. 따라서 최적의 너비는이 두 극단 사이에 있어야합니다.γ
아니요, 본질적으로 데이터에 따라 다릅니다. 그리드 검색 (로그 변환 된 하이퍼 파라미터를 통해)은 튜닝 할 하이퍼 파라미터가 적지 만 그리드 해상도를 너무 세밀하게 조정하지 않거나 튜닝에 너무 적합 할 경우 매우 좋은 방법입니다. 표준. 더 많은 수의 커널 매개 변수와 관련된 문제의 경우 Nelder-Mead 심플 렉스 방법이 잘 작동합니다.
본질적으로 "데이터 종속적"은 최상의 설정이 데이터의 특정 구조에 따라 달라지며 일반적으로 교차 유효성 검사 오류를 최소화하는 것보다 더 좋은 방법은 없습니다. 커널 방법은 실제로 커널 학습 방법에 대한 이론적 분석과 관련이있을 수 있지만 불행히도 수학적으로 매우 어렵습니다.
pair-wise distance for your data
= 스케일링 후 간단한 유클리드 거리?