데이터 세트에서 SVM (Support Vector Machine)을 사용하려고합니다. 그래도 문제를 시도하기 전에 SVM이 불균형이 심한 데이터에서 제대로 작동하지 않는다는 경고를 받았습니다. 제 경우에는 최대 95-98 % 0과 2-5 % 1을 가질 수 있습니다.
스파 스 / 언밸런스 드 데이터에서 SVM 사용에 대해 이야기 한 리소스를 찾으려고했지만 'sparseSVM'(소량의 지원 벡터를 사용) 만 찾을 수있었습니다.
누군가가 간단히 설명 할 수 있기를 바랐습니다.
- SVM이 그러한 데이터 세트와 얼마나 잘 관련되어 있는지
- SVM 알고리즘을 수정해야하는 경우
- 어떤 자료 / 논문이 이에 대해 논의 하는가