여러 분류자를 사용하여 분류를 수행하는 데이터로 분류 된 2 클래스가 있습니다. 그리고 데이터 세트의 균형이 잘 잡혀 있습니다. 분류 자의 성능을 평가할 때 분류자가 실제 긍정적 인 것뿐만 아니라 실제 부정적인 것을 결정하는 데 얼마나 정확한지 고려해야합니다. 따라서 정확도를 사용하고 분류자가 긍정적으로 편향되고 모든 것을 긍정적으로 분류하면 진정한 부정을 분류하지 못하더라도 약 50 %의 정확도를 얻습니다. 이 속성은 한 클래스에만 초점을 맞추고 F1- 점수에 중점을 두어 정확성과 리콜로 확장됩니다. (이것은 예를 들어 " 정확도, F- 점수 및 ROC를 넘어서 : 성능 평가를위한 판별 수단 "과 같은이 백서에서도 이해하고 있습니다 .
따라서 민감도와 특이도 (TPR 및 TNR)를 사용하여 분류자가 각 클래스에 대해 어떻게 수행되는지 확인할 수 있습니다. 여기서 이러한 값을 최대화하려고합니다.
내 질문은이 두 값을 하나의 의미있는 측정 값으로 결합하는 측정 값을 찾고 있다는 것 입니다. 나는 그 논문에 제공된 조치들을 조사했지만 그것이 사소한 것이 아니라는 것을 알았다. 그리고 내 이해를 바탕으로 F 점수와 같은 것을 적용 할 수없는 이유가 궁금했지만 정밀도와 기억을 사용하는 대신 감도와 특이성을 사용합니까? 따라서 공식은