현재 Scikit learn을 다음 코드로 사용하고 있습니다.
clf = svm.SVC(C=1.0, tol=1e-10, cache_size=600, kernel='rbf', gamma=0.0,
class_weight='auto')
그런 다음 7 개의 서로 다른 레이블이있는 일련의 데이터를 적합하게 예측합니다. 이상한 결과가 나왔습니다. 유효성 검사 세트에서 예측 된 레이블을 사용하는 교차 유효성 검사 기술에 관계없이 항상 레이블 7이됩니다.
전체 기본 매개 변수 ()를 포함하여 다른 매개 변수를 시도 svm.SVC()하지만 사용하는 커널 방법이 rbf대신 poly하거나 linear작동하지 않는 한 polyand에서는 실제로 잘 작동 linear합니다.
또한 유효성 검사 데이터 대신 열차 데이터에 대한 예측을 이미 시도했으며 완벽하게 맞습니다.
누구든지 전에 이런 종류의 문제를보고 여기에서 무슨 일이 일어나고 있는지 알고 있습니까?
클래스 분포를 자세히 보지는 않지만 30 %가 7, 14 %가 4라는 것을 알고 있습니다.
심지어 수동 1 대 나머지 구현을 시도해도 여전히 도움이되지 않습니다.