대규모 교육 데이터 세트를 사용하는 다중 클래스 텍스트 분류 문제에 대해 2 개의 다른 분류기를 비교하고 싶습니다. ROC 곡선을 사용해야하는지 아니면 학습 곡선을 사용하여 두 분류기를 비교해야하는지 궁금합니다.
한편, 학습 곡선은 분류 기가 학습을 중단하고 저하 될 수있는 데이터 세트의 크기를 찾을 수 있기 때문에 학습 데이터 세트의 크기를 결정하는 데 유용합니다. 따라서이 경우 가장 좋은 분류기는 가장 작은 데이터 세트 크기로 가장 높은 정확도에 도달 할 수 있습니다.
반면에 ROC 곡선을 사용하면 감도 / 특이성 사이에서 올바른 절충점을 찾을 수 있습니다. 이 경우 가장 좋은 분류기는 왼쪽 상단에 가장 가까운 분류기이며 FPR에 대해 가장 높은 TPR입니다.
두 가지 평가 방법을 모두 사용해야합니까? 더 나은 학습 곡선을 가진 방법이 더 나쁜 ROC 곡선을 가질 수 있습니까?