순서 형 로지스틱 회귀 분석의 AUC


10

나는 2 종류의 로지스틱 회귀를 사용하고 있습니다. 하나는 이진 분류를위한 간단한 유형이고 다른 하나는 순서 형 로지스틱 회귀입니다. 첫 번째 정확도를 계산하기 위해 교차 검증을 사용하여 각 접기에 대해 AUC를 계산하고 평균 AUC를 계산했습니다. 순서 형 로지스틱 회귀 분석을 위해 어떻게해야합니까? 멀티 클래스 예측 변수에 대한 일반화 된 ROC에 대해 들었지만 계산 방법을 잘 모르겠습니다.

감사!


1
AUC가 아니라 관련 : stats.stackexchange.com/questions/21551/
Yevgeny

답변:


4

나는 일치 확률이기 때문에 ROC 곡선 ( -index) 아래의 영역 만 좋아합니다 . 는 순위 상관 계수의 구성 요소입니다. 예를 들어, Somers ' 입니다. 서수 경우 는 예측 차별의 탁월한 척도이며, R 패키지는 부트 스트랩 과적 합 수정 된 추정값을 쉽게 얻을 수있는 방법을 제공합니다 . 일반화 된 인덱스 (일반화 된 AUROC)에 대해 백 솔브 할 수 있습니다 . 의 각 수준을 고려하지 않는 이유가 있습니다 이의 서수 자연을 이용하지 않는 별도 때문에 .ccDxy=2×(c12)YDxyrmsDxycYY

에서는 rms: 순서 회귀 두 함수 존재 lrm하고 orm, 후자의 연속 처리 비례 확률 분포 이상 군 (링크 기능)를 제공하는이.Y


주요 문제는 rms 가 Sommer의 사용 된 어떻게 계산 합니까? cindexDxy
Chamberlain Foncha

1
그것은 Somer 's 입니다. 일반화 된 인덱스는 단순히 위에 나열된 방정식 I을 역 분해하여 간단히 계산됩니다. 다른 값을 갖는 내부의 모든 가능한 관측 조합 이 검사되며, 예측이 동일한 순서로있는 쌍의 비율은 일치 확률의 추정치입니다. 한 가지를 놓쳤다 .이 함수는 대신 Spearman의 사용 합니다. cYormρDxy
Frank Harrell

철자 수정에 감사드립니다. 순서 회귀 분석에서는 언급 한 orm 함수에서와 같이 페어 단위 순서를 보는 것뿐만 아니라 클래스 수에 따라 일관된 순서 (삼항 이상의 연산자 사용)를 보는 것이 훨씬 더 흥미로울 것입니다. 요약하자면, 예를 들어 누적 로지스틱 회귀 분석을 사용하면 클래스 순서가 모델에서 처리됩니다. 예측 측정은 쌍별 비교 를 수행 할 수 없지만 $ P (pred_1 <pred_2 <pred_3 | obs_1 <obs_2 <oP(pred1<pred2|obs1<obs2)
Chamberlain Foncha

이러한 조치에 대해 알지 못하면 첫 번째 반응은 장애물을 높이는 것입니다.
Frank Harrell

1

순서 회귀 분석을위한 AUC는 까다로운 작업입니다. AUC를 계산하는 클래스의 값 1을 가져오고 나머지 다른 클래스의 경우 0을 가져 오도록 인형을 작성하여 각 클래스의 AUC를 계산할 수 있습니다. 4 개의 클래스가있는 경우 4 개의 AUC를 작성하여 동일한 그래프에 플롯합니다. 이 방법의 주된 문제점은 미스 분류에 동일하게 불이익을 준다는 사실입니다. 클래스 1을 클래스 3으로 잘못 분류하는 것이 훨씬 직관적으로 클래스 1을 클래스 2로 분류하는 것보다 최악이어야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.