방금 이 토론을 읽었습니다 . 그들은 PR AUC가 불균형 데이터 세트에서 ROC AUC보다 낫다고 주장합니다.
예를 들어 테스트 데이터 세트에 10 개의 샘플이 있습니다. 9 개의 샘플은 양수이고 1은 음수입니다. 모든 것을 긍정적으로 예측하는 끔찍한 모델이 있습니다. 따라서 TP = 9, FP = 1, TN = 0, FN = 0이라는 메트릭이 있습니다.
그런 다음 정밀도 = 0.9, 리콜 = 1.0입니다. 정밀도와 리콜은 모두 매우 높지만 분류 기가 불량합니다.
한편, TPR = TP / (TP + FN) = 1.0, FPR = FP / (FP + TN) = 1.0. FPR이 매우 높기 때문에 이것이 분류 기가 좋지 않다는 것을 알 수 있습니다.
분명히, 불균형 데이터 세트에서 ROC는 PR보다 낫습니다. PR이 더 좋은 이유를 누군가 설명 할 수 있습니까?