오프셋을 사용하여 GLM 푸 아송 예측


9

나는 이것이 아마도 기본적인 질문이라는 것을 알고 있습니다 ... 그러나 나는 대답을 찾지 못하는 것 같습니다.

Poisson 제품군에 GLM을 적용한 다음 예측을 살펴 보려고했지만 오프셋이 고려되는 것 같습니다.

model_glm=glm(cases~rhs(data$year,2003)+lhs(data$year,2003),
offset=(log(population)), data=data, subset=28:36, family=poisson())

predict (model_glm, type="response")

요금이 아닌 경우가 있습니다 ...

나는 또한 시도했다

model_glm=glm(cases~rhs(data$year,2003)+lhs(data$year,2003)+
offset(log(population)), data=data, subset=28:36, family=poisson())

같은 결과로. 그러나 mgcv를 사용하여 GAM에서 예측 할 때 예측은 오프셋 (속도를 얻습니다)을 고려합니다.

뭔가 빠졌습니까?


1
여기와 r-help 목록에 교차 게시하지 마십시오 ... 그리고 stackoverflow / stackexchange 포럼에 게시하려는 경우 SO가 더 좋을 것이라고 생각합니다 (이것은 통계 질문이 아니라 기술적 인 R 질문입니다) ...)
Ben Bolker

답변:


12

사례를 예측하기 때문에 요율 대신 사례를 얻는 것이 맞습니다. 비율을 얻으려면 모든 열이 데이터와 같지만 모집단 열이 1과 같고 log (populaton) = 0이되도록 새 데이터 세트에 예측 방법을 사용해야합니다. 이 경우 한 모집단 단위의 사례 수, 즉 비율을 얻게됩니다.


1
대답 해 주셔서 감사합니다. 사례를 예측하는 것이 이상하지는 않지만 요율 (사례 / 인구)에 대한 예측을 설정하기 위해 뭔가 빠진 것으로 생각했습니다. GAM에서 나는 예측하기 위해 다른 것을 추가 할 필요가 없었습니다 (사례 / 인구).
Sandra
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.