Poisson GLM이 정수가 아닌 숫자를 허용한다는 사실에 정말 놀랐습니다! 보기:
데이터 (의 내용 data.txt
) :
1 2001 0.25 1
1 2002 0.5 1
1 2003 1 1
2 2001 0.25 1
2 2002 0.5 1
2 2003 1 1
R 스크립트 :
t <- read.table("data.txt")
names(t) <- c('site', 'year', 'count', 'weight')
tm <- glm(count ~ 0 + as.factor(site) + as.factor(year), data = t,
family = "quasipoisson") # also works with family="poisson"
years <- 2001:2003
plot(years, exp(c(0, tail(coef(tm), length(years)-1))), type = "l")
결과 연도 지수는 "예상", 즉 1-2-4
연도 2001-2003
입니다.
그러나 포아송 GLM이 정수가 아닌 숫자를 어떻게 사용할 수 있습니까? 푸 아송 분포는 항상 정수 전용입니다!
family="poisson"
하지는 않지만 quasipoisson
가족을 사용할 때 귀하의 예제는 Poisson GLM이 아니라는 점에 유의하십시오. 어쨌든 평균과 분산의 관계에만 의존합니다. 정수가 아닌 숫자를 취하는 것에 놀라지 않아야합니다.