로그 오프셋을 갖는 이진 모델 (Probit 및 Logit)


12

누구나 probit 및 logit과 같은 이진 모델에서 오프셋이 어떻게 작동하는지 파생 되었습니까?

내 문제에서 후속 창 길이가 다를 수 있습니다. 환자가 치료법으로 예방 주사를받는다고 가정하십시오. 주사는 다른 시간에 발생하므로 결과가 플레어 발생 여부에 대한 이진 지표 인 경우 일부 사람들이 증상을 나타낼 시간이 더 있다는 사실을 조정해야합니다. 플레어 업의 확률은 후속 기간의 길이에 비례하는 것으로 보인다. 오프셋이있는 이진 모델이 어떻게 포 직과 달리이 직관을 포착하는지는 수학적으로 명확하지 않습니다 .

오프셋은 Stata (p.1666)R 모두의 표준 옵션이며 Poisson의 경우 쉽게 볼 수 있지만 이진 경우는 약간 불투명합니다.

예를 들어

E[y|x]Z=exp{xβ},
이것은 대수적으로
E[y|x]=exp{xβ+logZ},
의 계수 표준 모델logZ구속1. 이것을로그 오프셋이라고합니다. exp{}Φ()또는Λ로 바꾸면어떻게 작동하는지 알아내는 데 어려움이 있습니다.Λ() .

업데이트 # 1 :

로짓 사건은 아래에 설명되어 있습니다.

업데이트 # 2 :

βx=2z=2xxz

답변:


8

당신은 항상에서 오프셋 포함 할 수 있는 GLM을 : 그것은 누구의 계수 1. 포아송 회귀에 고정되어 그냥 아주 일반적인 사용 사례 될 일이 단지 예측 변수입니다.

이항 모델에서 오프셋으로 로그 노출하는 아날로그는 이항 분모 일 뿐이므로 일반적으로 명시 적으로 지정할 필요가 없습니다. Poisson RV를 로그 노출을 오프셋으로, 또는 노출과 가중치로 비율로 카운트로 모델링 할 수있는 것처럼, 이항 RV를 성공 및 실패 횟수로 또는 시험을 수행하는 빈도로 모델링 할 수 있습니다. 무게.

logZZp/(1p)

log(p/(1p))=βX+logZp/(1p)=Zexp(βX)

그러나 이것은 포아송 회귀 분석에서 로그 노출과 같이 특별한 의미가 없습니다. 즉, 이항 확률이 충분히 작 으면 로지스틱 모델은 로그 링크 (LHS의 분모가 1에 가까우므로)를 사용하여 포아송 모델에 접근하고 오프셋은 로그 노출 기간으로 취급 될 수 있습니다.

(당신의 링크 된 R 질문에 설명 된 문제는 오히려 특이합니다.)


Pr(Y=1|X)=Φ(xβ+ln(t))ttt

확률이 아니라 승산 비입니다. 바라건대 편집이 더 명확 해지기를 바랍니다.
Hong Ooi

승산 비 측면에서 문제를 표현하면 매우 분명합니다. 프로 빗은 어떻습니까?
Dimitriy V. Masterov

가 표준 링크가 아니며 probit 이진 종속 변수가 지수 계열에 속하지 않기 때문에 이것이 probit에서 작동하거나 최소한 깨끗한 해석을 기대 하지는 않습니다. Φ()
StasK

@StasK 맞습니다. 그런데 왜 Stata와 R에 이러한 옵션이 있습니까? 그들은 무엇을 성취합니까?
Dimitriy V. Masterov

1

이것을 사건 발생 시간 문제로 바꾸면 ln (time) 오프셋을 가진 로지스틱 모델이 데이터에 잘 맞거나 맞지 않을 수있는 파라 메트릭 생존 함수를 효과적으로 커밋하지 않습니까?

p / (1-p) = Z * exp (xbeta)

p = [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

시간 Z에서 예측 된 생존 = 1- [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.