주어진
- 모든 인스턴스 정확히 하나의 클래스 속하는 클래스 와 함께 인스턴스 를 가진 데이터 세트
- 멀티 클래스 분류기
훈련 및 테스트 후 기본적으로 테스트 세트의 모든 인스턴스 에 대해 실제 클래스 및 예상 클래스 가있는 테이블이 있습니다. 따라서 모든 인스턴스에 대해 일치하는 ( ) 또는 누락 된 ( ) 있습니다.
경기의 질을 어떻게 평가할 수 있습니까? 문제는 일부 클래스에는 많은 멤버가있을 수 있다는 것입니다. 즉, 많은 인스턴스가 여기에 속합니다. 분명히 모든 데이터 포인트의 50 %가 하나의 클래스에 속하고 최종 분류자가 전체적으로 50 % 정확하다면 아무것도 얻지 못했습니다. 입력이 무엇이든 상관없이 가장 큰 클래스를 출력하는 간단한 분류기를 만들 수도 있습니다.
알려진 테스트 세트 각 클래스의 일치 및 적중 결과를 기반으로 분류기의 품질을 추정하는 표준 방법이 있습니까? 특정 클래스마다 일치하는 비율을 구별하는 것이 중요 할 수도 있습니다.
내가 생각할 수있는 가장 간단한 방법은 가장 큰 클래스의 올바른 일치 항목을 제외시키는 것입니다. 또 뭐요?