(d-prime)과 AUC (ROC 곡선 아래 영역) 사이의 연결 ; 기본 가정


13

기계 학습에서는 시스템 이 두 범주를 얼마나 잘 구별 할 수 있는지를 요약하기 위해 ROC 곡선 아래 영역 (대개 약어 AUC 또는 AUROC)을 사용할 수 있습니다. 신호 검출 이론에서 종종 (감도 지수) 는 비슷한 목적으로 사용됩니다. 이 두 가지는 밀접하게 연결되어 있으며 특정 가정이 충족되면 서로 동등 하다고 생각 합니다.d

의 계산은 일반적으로 (위키는 예를 들어, 상기 링크 참조), 신호 분배에 대한 정규 분포를 가정에 기초하여 제공된다. ROC 곡선 계산에서는 이러한 가정이 이루어지지 않습니다. 임계 값을 지정할 수있는 연속 값 결정 기준을 출력하는 분류기에 적용 할 수 있습니다.d

위키 백과는 말합니다 그 동등하다 . 둘 다의 가정이 만족된다면 이것은 올바른 것 같습니다. 그러나 가정이 같지 않다면 그것은 보편적 인 진실이 아닙니다.d2AUC1

"AUC가 기본 분포에 대한 가정을 적게한다"는 가정의 차이를 특성화하는 것이 공정합니까? 또는 실제로 AUC만큼 광범위하게 적용 가능하지만 를 사용 하는 사람들 이 정규 분포를 가정하는 계산을 사용하는 경향이 있는 것이 일반적인 관례 입니까? 내가 놓친 기본 가정에 다른 차이점이 있습니까?dd

답변:


7

아니요. AUC의 최대 값은 1입니다. d '에는 최대 값이 없습니다.

나는 d '가 qnorm (AUC) * sqrt (2)와 같다고 생각합니다 (오래된 통계 책에 대한 기억은 지금은 찾을 수 없지만 웹에서 찾은 일부 데이터를 확인하는 것 같습니다). 여기서 qnorm (x)는 "정규 분포에 대한 양자 함수"(R-speak)입니다. 즉, 분포의 x 비율이 그 아래에있는 정규 분포 값을 반환합니다.


2
고마워, 이것은 나에게 맞는 것처럼 들리지만, 분포가 정상이라고 가정 할 때만 (qnorm () 사용하기 때문에). 위키 백과 문구를 수정했습니다.
Dan Stowell
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.