나는 두 가지 일반적인 / 더 이론적 인 질문이 있습니다.
1) 예측 모델을 작성할 때 SVM이 변수 상호 작용을 처리하는 방법이 궁금합니다. 예를 들어, f1과 f2의 두 가지 기능이 있고 목표가 f1, f2에 의존하고 f1 * f2 (또는 일부 함수 h (f1, f2))라고 말하면 SVM이 적합합니까 (OOS뿐만 아니라 훈련 데이터에도) f1 및 f2를 포함하는 것 이상의 기능에 f1, f2 및 h (f1, f2)를 포함 시키면 개선됩니까? SVM 알고리즘은 기능 상호 작용을 처리합니까? SVM이 더 높은 차원의 공간에서 초평면을 생성하려고 시도하는 것처럼 보이지만 그렇게 요구하고 싶지는 않습니다.
2) SVM을 훈련 데이터에 장착 할 때 충분한 기능과 최적의 매개 변수 찾기 (무차별 검색 등)를 통해 SVM이 훈련 데이터에 항상 적합할까요? 내가 올바르게 말했는지 확실하지 않지만 기본적으로 기능에 충분한 분산 / 소음이있는 경우 SVM이 항상 훈련 데이터에 100 % 적합합니까? 반대로, SVM이 교육 데이터에 100 % 적합하지 않은 경우 데이터에서 캡처되지 않은 대상 변수에 영향을주는 정보 (또는 다른 기능)가 있다는 의미입니까?
감사
작은 설명. 커널 SVM을 구체적으로 언급하고 있습니다.