포아송 회귀 분석에서 오프셋을 언제 사용해야합니까?


67

푸 아송 회귀 분석에서 왜 오프셋이 사용되는지 아는 사람이 있습니까? 이것으로 무엇을 달성합니까?

답변:


93

다음은 적용 예입니다.

푸 아송 회귀는 일반적으로 카운트 데이터를 모델링하는 데 사용됩니다. 그러나 때로는 카운트 대신 모델 속도와 관련이 있습니다. 예를 들어 개인이 같은 시간을 따르지 않는 경우에 해당됩니다. 예를 들어, 1 년 동안 6 건이 10 년 동안 6 건으로 동일하지 않아야합니다. 그래서, 대신에

logμx=β0+β1x

(여기서 는 공변량 사람들의 예상 카운트입니다 )μxx

logμxtx=β0+β1x

(여기서 는 공변량 사람들의 노출 시간입니다 ). 이제 마지막 방정식을 다시 쓸 수 있습니다txx

logμx=logtx+β0+β1x

및 오프셋의 역할을한다.logtx


2
고마워요! 다른 시간에 걸쳐 카운트를 비교할 때 오프셋을 사용해야하는 것이 옳았습니까?
MarkDollar

1
@ MarkDollar : !!
ocram

2
비율을 할 때 가중치를 해야 합니다. 일반적으로 관측 단위가 일부 차원 (다른 모집단, 다른 지리적 크기)에서 다르고 결과가 해당 차원에 비례하기 때문에 오프셋을 사용합니다. tx
Dimitriy V. Masterov

1
@ocram. 나는 당신의 대답이 훌륭하다고 생각하며 궁금합니다. 여기서 문제가 설명되어있는 문헌 참조를 알고 있습니까? 사전에 감사합니다
jmjr

1
@ocram 와 의미는 무엇 입니까? 각 대한 응답 변수는 무엇 입니까? xtxxi
Metariat
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.