두 개의 분류 기가 있습니다
- A : 순진한 베이지안 네트워크
- B : 트리 (단일 연결) 베이지안 네트워크
정확성 및 기타 측정 측면에서 A는 B보다 상대적으로 성능이 좋지 않지만 R 패키지 ROCR 및 AUC를 사용하여 ROC 분석을 수행하면 A의 AUC가 B의 AUC보다 높은 것으로 나타났습니다. 사고?
진 양성 (tp), 위양성 (fp), 위음성 (fn), 진 음성 (tn), 감도 (sen), 특이성 (spec), 양성 예측값 (ppv), 음성 예측값 (npv) 및 A와 B의 정확도 (acc)는 다음과 같습니다.
+------+---------+---------+
| | A | B |
+------+---------+---------+
| tp | 3601 | 769 |
| fp | 0 | 0 |
| fn | 6569 | 5918 |
| tn | 15655 | 19138 |
| sens | 0.35408 | 0.11500 |
| spec | 1.00000 | 1.00000 |
| ppv | 1.00000 | 1.00000 |
| npv | 0.70442 | 0.76381 |
| acc | 0.74563 | 0.77084 |
+------+---------+---------+
한계 값 (tp, fn, fn 및 tn 제외)에 대한 감각 및 연계 (spec 및 ppv)를 제외하고 B는 A보다 성능이 우수한 것으로 보입니다.
감각 (y 축) 대 1 스펙 (x 축)에 대한 AUC를 계산할 때
aucroc <- auc(roc(data$prediction,data$labels));
다음은 AUC 비교입니다.
+----------------+---------+---------+
| | A | B |
+----------------+---------+---------+
| sens vs 1-spec | 0.77540 | 0.64590 |
| sens vs spec | 0.70770 | 0.61000 |
+----------------+---------+---------+
내 질문은 다음과 같습니다.
- B가 정확도와 관련하여 A보다 성능이 우수한 것으로 간주 될 때 A에 대한 AUC가 B보다 나은 이유는 무엇입니까?
- 그렇다면 A와 B의 분류 성능을 어떻게 실제로 판단 / 비교합니까? AUC 값을 사용합니까? acc 값을 사용합니까? 그렇다면 왜됩니까?
- 또한 A와 B에 적절한 점수 규칙을 적용하면 B가 로그 손실, 2 차 손실 및 구면 손실 측면에서 A보다 뛰어납니다 (p <0.001). 이것들은 AUC와 관련하여 분류 성능을 판단하는 데 어떻게 중요합니까?
- A에 대한 ROC 그래프는 매우 매끄럽게 보이지만 (곡선 호) B에 대한 ROC 그래프는 연결된 선 집합처럼 보입니다. 왜 이런거야?
요청한대로 다음은 모델 A에 대한 도표입니다.
다음은 모델 B에 대한 도표입니다.
다음은 A와 B에 대한 확률 분포의 히스토그램 플롯입니다 (파단은 20으로 설정 됨).
다음은 B와 A의 확률에 대한 산포도입니다.