scikit의 다중 레이블 분류 지표
scikit을 사용하여 기존 문서에 주제를 할당하기 위해 다중 레이블 분류기를 작성하려고합니다. 나는 통해 전달 내 문서를 처리하고 TfidfVectorizer하여 통해 라벨 MultiLabelBinarizer과를 만들어 OneVsRestClassifier와 SGDClassifier추있다. 그러나 내 분류기를 테스트 할 때 나는 .29 까지의 점수 만 얻습니다.이 점수 는 비슷한 문제에 대해 꽤 낮습니다. 나는 스톱 워드, 유니 그램, 형태소 분석과 …