가능성을 최대화하는 로지스틱 회귀 분석이 선형 모델보다 AUC를 최대화해야합니까?


13

이항 결과 y{0,1}n 및 일부 예측 변수 행렬 XRn×p 갖는 데이터 세트가 주어지면 표준 로지스틱 회귀 모델 은 이항 우도를 최대화하는 계수 βMLE 를 추정 합니다. X 가 전체 순위 일 때 βMLE 는 유일하다; 완벽한 분리가 없으면 유한합니다.

이 최대 우도 모델이 ROC AUC (일명 c 통계)를 최대화합니까 , 아니면 더 높은 ROC AUC를 얻을 수있는 계수 추정치 βAUCβMLE 가 있습니까? MLE가 반드시 ROC AUC를 최대화 할 필요는없는 경우,이 질문을 보는 또 다른 방법은 "물류 회귀 분석의 ROC AUC를 항상 최대화 할 가능성 최대화에 대한 대안이 있습니까?"입니다.

나는 모델이 달리 같다고 가정합니다 : 우리는 X 에서 예측 변수를 추가하거나 제거하지 않거나 모델 사양을 변경 하지 않으며 가능성을 최대화하고 AUC를 최대화하는 모델이 동일한 링크 함수를 사용한다고 가정합니다.


2
예를 들어, 일부 링크 함수가 로짓보다 더 잘 맞는다면 반드시 ? 그 외에는 데이터 생성 프로세스가 로짓으로 가정 될 수 있다면 좋은 질문입니다. βAUCβMLE
Nutle

좋은 질문이지만 이것을 고려하십시오. ROC와 AUC는 서로 다른 두 모델을 비교하는 데 사용되므로 모델의 MLE 추정 솔루션이 고유 한 경우 현재 모델의 사양을 변경하고 다른 모델을 추정 할 경우에만 다른 AUC를 얻을 수 있습니다. MLE를 통한 모델. 따라서이 시점에서 또 다른 질문은 : 새로운 "더 나은"베타로 이어지는 계수의 다른 추정치에 도달 할 수 있도록 동일한 모델에 적용 가능한 간단한 MLE 이외의 다른 "더 나은"추정 방법 (최대화 알고리즘 ecc)이 있습니까? 더 높은 AUC?
Fr1

@Nutle 정확하게, 그것은 다른 사양 일 것입니다
Fr1

@ Fr1 네, 이것이 독특한 의미입니다. 내 질문에 암시하는 것은 "높은 AUC를 달성하는 MLE에 대한 대안이 있다면 어떨까요?"와 같은 것입니다. 더 높은 AUC를 달성하는 다른 선형 모델 (MLE 이외의 모델)이있는 것이 사실이라면, 그것은 흥미로울 것입니다.
Sycorax는 Reinstate Monica가

1
@Sycorax 다른 우리가 가정 무엇을? :) 우리가하면 이후 가정이 중요하다 알고 사용 링크 변수와 진정한 DGP을의 MLE 균일 가장 강력한 편견 통계입니다.
Nutle

답변:


11

βMLE=βAUC 경우는 아니다 .

이를 설명하기 위해 AUC는 다음과 같이 작성할 수 있습니다.

P(y^1>y^0|y1=1,y0=0)

βMLE

βAUCββMLEβAUC

편집 (댓글을 답변으로 이동)

xx>6βxxβMLE<0


1
(+1) 아! 물론 주문에 관한 것이므로 우연히 가능성 값을 변경 해야하는 절편을 임의로 변경할 수 있지만, 특성 계수가 변경되지 않았기 때문에 순서는 동일해야하므로 AUC는 고정 상태로 유지됩니다.
Sycorax는 Reinstate Monica가

nxn

nnn

xn
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.