로지스틱 회귀 분석을위한 최대 가능성 추정기의 편차


10

로지스틱 회귀 분석에 대한 최대 가능성 추정기 (MLE)에 대한 몇 가지 사실을 알고 싶습니다.

  1. 일반적으로 로지스틱 회귀에 대한 MLE이 편향되어 있다는 것이 사실입니까? 나는 "예"라고 말할 것입니다. 예를 들어, 샘플 치수는 MLE의 점근 적 편향과 관련이 있습니다.

    이 현상의 기본 예를 알고 있습니까?

  2. MLE이 편향되어있는 경우 MLE의 공분산 행렬이 최대 우도 함수의 헤 시안의 역수라는 것이 사실입니까?

    편집 : 나는이 공식을 꽤 자주 만났으며 아무런 증거없이; 그것은 나에게 아주 임의적 인 선택 인 것 같습니다.

답변:


15

이항 종속 변수가 있고 상수 및 이진 회귀 기 만있는 단순 이항 로지스틱 회귀 모델을 고려하십시오 . 여기서 \ Lambda 는 로지스틱 cdf입니다. \ Lambda (u) = \ left [1+ \ exp \ {-u \} \ right] ^ {-1} 입니다.T

Pr(Yi=1Ti=1)=Λ(α+βTi)
ΛΛ(u)=[1+exp{u}]1

로짓 형식으로

ln(Pr(Yi=1Ti=1)1Pr(Yi=1Ti=1))=α+βTi

크기가 표본이 있습니다 . 은 이고 은 이고 인 관측치 수를 나타냅니다 . 다음과 같은 추정 조건부 확률을 고려하십시오.nn1Ti=1n0Ti=0n1+n0=n

Pr^(Y=1T=1)P^1|1=1n1Ti=1yi

Pr^(Y=1T=0)P^1|0=1n0Ti=0yi

그런 다음이 매우 기본적인 모델은 ML 추정기에 폐쇄 형 솔루션을 제공합니다.

α^=ln(P^1|01P^1|0),β^=ln(P^1|11P^1|1)ln(P^1|01P^1|0)

편견

하지만 와 대응하는 확률의 불편 추정량은 비 선형 대수 함수가 더 복잡한 모델을 발생하는 방식 -imagine에서 얻을 수 있기 때문에, MLEs는 바이어스된다 비선형 성 수준이 더 높습니다.P^1|1P^1|0

그러나 확률 추정값은 일관성이 있기 때문에 편견이 사라집니다. 연산자를 예상 값과 로그에 직접 삽입하면lim

limnE[α^]=E[ln(limnP^1|01P^1|0)]=E[ln(P1|01P1|0)]=α

도 마찬가지입니다 . β

VLEANCE-COVARIANCE MATRIX OF MLE
위의 간단한 경우 추정기에 폐쇄 형 표현을 제공하는 경우 원칙적으로 정확한 유한 샘플 분포를 도출 한 다음 정확한 유한 샘플 분산-공분산 행렬을 계산할 수 있습니다. . 그러나 일반적으로 MLE에는 폐쇄 형 솔루션이 없습니다. 그런 다음 우리 는 점근 적 분산 공분산 행렬 의 일관된 추정 에 의지하는데 , 이는 실제로 MLE에서 평가 된 표본의 로그 우도 함수에 대한 헤 시안의 역수 (음수)입니다. 그리고 여기에 "임의 선택"은 없지만, 그것은 점근 론과 MLE (일관성 및 점근 법 정규성)의 점근 적 특성에서 됩니다. , θ0=(α,β)

n(θ^θ0)dN(0,(E[H])1)

여기서 는 헤 시안입니다. 대략적으로 (대형) 유한 샘플의 경우H

바르(θ^)1(이자형[H])11(1H^)1=H^1
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.