나는이 데이터를 가지고있다 :
set.seed(1)
predictor <- rnorm(20)
set.seed(1)
counts <- c(sample(1:1000, 20))
df <- data.frame(counts, predictor)
포아송 회귀 분석을 실행했습니다
poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson")
부정적인 이항 회귀
require(MASS)
nb_counts <- glm.nb(counts ~ predictor, data = df)
그런 다음 포아송 회귀에 대한 분산 통계를 계산했습니다.
sum(residuals(poisson_counts, type="pearson")^2)/df.residual(poisson_counts)
# [1] 145.4905
그리고 부정적인 이항 회귀 :
sum(residuals(nb_counts, type="pearson")^2)/df.residual(nb_counts)
# [1] 0.7650289
음의 이항 회귀에 대한 분산 통계가 포아송 회귀에 대한 분산 통계보다 상당히 작은 이유는 무엇입니까?