짧은 문장을위한 텍스트 분류기를 만들고 있습니다. 사용자에게 "입력 한 텍스트의 범주는 C입니다"라고 말하는 것 외에도이 결정을 내린 이유를 간단하고 이해하기 쉽게 설명하고 싶습니다. 예를 들어, 나는 사용자에게 "나는 당신의 문장을 복잡한 3 계층 신경망에 넣었고 이것이 최고의 점수를 얻은 답"이라고 말하고 싶지 않습니다. "훈련 데이터에 나타나는 X, Y 및 Z와 같은 문장으로 인해 문장에이 범주의 특징 인 단어 U, V 및 W가 포함되어 있습니다"와 같은 설명을 원합니다.
내 질문은 : 이러한 분류에 가장 적합한 분류 알고리즘은 무엇입니까?
k-nearest-neighbours는 사용자에게 "당신의 문장은 같은 범주를 가진 문장 X, Y 및 Z와 유사하기 때문에 범주 C를 가지고 있습니다. 그러나 텍스트 분류 문제에 대한 성능은 나는 성능과 설명 능력의 균형을 잡는 분류를 찾고 있습니다.
편집 : 이러한 분류기를 찾는 데 많은 시간을 보낸 후 limdu 라는 기계 학습 라이브러리를 작성하기 시작했습니다.이 라이브러리 는 분류자가 결정을 설명 할 수 있습니다. 아직 개발 중이지만 분류자가 너무 자주 실패하는 이유를 나와 동료에게 설명하는 데 이미 도움이되었습니다 ...