비 팽창 조류 수를 분석하기 위해 R 패키지 pscl을 사용하여 무 팽창 수 모델을 적용하고 싶습니다 . 그러나 주요 기능 중 하나 ( ? zeroinfl ) 에 대한 설명서에 제공된 예제를 살펴보면 이러한 모델의 실제 이점이 무엇인지 의심하기 시작합니다. 주어진 샘플 코드에 따르면, 표준 포아송, 준-포아송 및 음수 이코노미 얼 모델, 단순 제로 팽창 포아송 및 음수 이항 모델과 제로 팽창 포아송 및 음 이항 모델을 제로 성분에 대한 회귀 분석기로 계산했습니다. 그런 다음 관측 된 데이터와 적합 데이터의 히스토그램을 검사했습니다. (복제 코드는 다음과 같습니다.)
library(pscl)
data("bioChemists", package = "pscl")
## standard count data models
fm_pois <- glm(art ~ ., data = bioChemists, family = poisson)
fm_qpois <- glm(art ~ ., data = bioChemists, family = quasipoisson)
fm_nb <- glm.nb(art ~ ., data = bioChemists)
## with simple inflation (no regressors for zero component)
fm_zip <- zeroinfl(art ~ . | 1, data = bioChemists)
fm_zinb <- zeroinfl(art ~ . | 1, data = bioChemists, dist = "negbin")
## inflation with regressors
fm_zip2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists)
fm_zinb2 <- zeroinfl(art ~ fem + mar + kid5 + phd + ment | fem + mar + kid5 + phd +
ment, data = bioChemists, dist = "negbin")
## histograms
breaks <- seq(-0.5,20.5,1)
par(mfrow=c(4,2))
hist(bioChemists$art, breaks=breaks)
hist(fitted(fm_pois), breaks=breaks)
hist(fitted(fm_qpois), breaks=breaks)
hist(fitted(fm_nb), breaks=breaks)
hist(fitted(fm_zip), breaks=breaks)
hist(fitted(fm_zinb), breaks=breaks)
hist(fitted(fm_zip2), breaks=breaks)
hist(fitted(fm_zinb2), breaks=breaks)!
나는 다른 모델들 사이에 근본적인 차이를 볼 수 없다 (예제 데이터가 나에게 "제로 팽창되지 않은"것으로 보이지 않는다는 것 외에는 ...); 실제로 어떤 모델도 제로 수의 절반을 합리적으로 추정하지 않습니다. 아무도 제로 팽창 모델의 장점을 설명 할 수 있습니까? 함수의 예제로 이것을 선택해야 할 이유가 있다고 가정합니다.