현재 Scikit learn을 다음 코드로 사용하고 있습니다.
clf = svm.SVC(C=1.0, tol=1e-10, cache_size=600, kernel='rbf', gamma=0.0,
class_weight='auto')
그런 다음 7 개의 서로 다른 레이블이있는 일련의 데이터를 적합하게 예측합니다. 이상한 결과가 나왔습니다. 유효성 검사 세트에서 예측 된 레이블을 사용하는 교차 유효성 검사 기술에 관계없이 항상 레이블 7이됩니다.
전체 기본 매개 변수 ()를 포함하여 다른 매개 변수를 시도 svm.SVC()
하지만 사용하는 커널 방법이 rbf
대신 poly
하거나 linear
작동하지 않는 한 poly
and에서는 실제로 잘 작동 linear
합니다.
또한 유효성 검사 데이터 대신 열차 데이터에 대한 예측을 이미 시도했으며 완벽하게 맞습니다.
누구든지 전에 이런 종류의 문제를보고 여기에서 무슨 일이 일어나고 있는지 알고 있습니까?
클래스 분포를 자세히 보지는 않지만 30 %가 7, 14 %가 4라는 것을 알고 있습니다.
심지어 수동 1 대 나머지 구현을 시도해도 여전히 도움이되지 않습니다.