두 통계 척도는 서로 관련이있을 수 있지만 분류기의 다른 특성을 측정합니다.
아우 로크
곡선 아래의 면적 (AUC)은 분류자가 무작위로 선택된 양성 사례보다 무작위로 선택된 양성 사례의 순위를 매길 확률과 같습니다. 패턴을 양의 클래스에 속하는 정도에 따라 패턴 세트의 순위를 매기 는 클래스의 스킬을 측정 하지만 실제로 클래스에 패턴을 지정하지는 않습니다.
전반적인 정확도는 또한 분류자가 패턴의 순위를 매기는 능력에 따라 달라 지지만, 임계 값보다 높은 경우 패턴을 양의 클래스에 할당하는 데 사용되는 순위에서 임계 값을 선택하는 능력에 따라 달라지며 아래의 경우 음의 클래스에 패턴을 지정합니다.
따라서 AUROC 통계가 더 높은 분류기 (모든 것이 동일 함)는 패턴 순위 (AUROC가 측정)가 AUROC 및 전체 정확도 모두에 유리하기 때문에 전체 정확도가 더 높아질 수 있습니다. 그러나 하나의 분류 기가 패턴의 순위를 매기지만 임계 값을 잘못 선택하면 AUROC는 높지만 전체 정확도는 떨어질 수 있습니다.
실용
실제로, 나는 전체 정확도, AUROC 및 분류자가 클래스 멤버십의 확률, 교차 엔트로피 또는 예측 정보를 추정하는 것을 좋아합니다. 그런 다음 하드 분류를 수행 할 수있는 원시 능력을 측정하는 메트릭이 있습니다 (가양 성 및 오 음성 오 분류 비용이 동일하고 샘플의 클래스 빈도가 운영 용도의 것과 동일하다고 가정 함). 패턴 순위 지정 기능을 측정하는 메트릭 및 순위가 확률로 얼마나 잘 교정되는지 측정하는 메트릭.
많은 작업의 경우 운영 오 분류 비용을 알 수 없거나 가변적이거나 운영 클래스 빈도가 교육 샘플과 다르거 나 가변적입니다. 이 경우 전체 정확도는 종종 의미가 없으며 AUROC는 성능을 더 잘 나타내는 지표이며 이상적으로는 잘 보정 된 확률을 출력하는 분류기를 사용하여 운영상의 이러한 문제를 보완 할 수 있습니다. 본질적으로 어떤 측정 항목이 중요한지는 해결하려는 문제에 따라 다릅니다.