제로 팽창 된 포아송 또는 제로 팽창 된 음 이항에 대한 "이탈"측정?


11

D = 2 * (포화 모델의 로그 우도에서 적합 모델의 로그 우도)로 정의 된 축척 편차는 종종 GLM 모델에서 적합도의 척도로 사용됩니다. 설명 된 이탈률은 [D (null model)-D (fitted model)] / D (null model)로 정의되며 선형 회귀의 R- 제곱에 대한 GLM 아날로그로도 사용됩니다. ZIP 및 ZINB 분포가 지수 분포의 일부가 아니라는 사실 외에도, 설명 된 스케일 이탈 및 백분율 이탈이 제로 팽창 모델링에 사용되지 않는 이유를 이해하는 데 어려움이 있습니다. 누구든지 이것에 대해 밝히거나 유용한 참고 자료를 제공 할 수 있습니까? 미리 감사드립니다!


아주 좋은 질문-나도 이것을 알고 싶습니다
user2673238

답변:


3

이탈은 GLM 개념이며, ZIP 및 ZINB 모델은 glm이 아니지만 GLM 인 유한 분포의 혼합으로 공식화되어 EM 알고리즘을 통해 쉽게 해결할 수 있습니다.

이 노트 는 이탈 이론을 간결하게 설명합니다. 이 노트를 읽으면 포아송 회귀에 대한 포화 모형에 로그 우도가 있다는 증거가 표시됩니다.

(λs)=i=1,yi0n[yilog(yi)yilog(yi!)]

yi=λ^i

i

i(ϕ,λ)=Zilog(ϕ+(1ϕ)eλ)+(1Zi)[λ+yilog(λ)log(yi!)].

Ziλϕλϕyi=0λ^ϕ^Ziyi=0Zi우리는 누락 된 데이터가 없기 때문에 ZIP 모델이 필요하지 않습니다. 관찰 된 데이터는 EM 형식주의의 "완전한 데이터"가능성에 해당합니다.

ZiE(i(ϕ,λ))Ziexpected

또한이 질문이 먼저 제기 되어이 게시물에 대답했습니다. 그러나 여기 고든 스미스에 의해 좋은 의견과 동일한 주제에 대한 또 다른 질문이 있습니다 : 일탈 제로 팽창 복합 포아송 모델, 연속적인 데이터 (R)에 대한 그 같은 응답을 언급 (이 그 의견의 정교화가 나는 것입니다 또한) 그들은 다른 게시물에 대한 주석에서 당신이 읽고 싶을 수도있는 논문을 언급했습니다. (면책 조항, 참조 된 논문을 읽지 않았습니다)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.