데이터에 가장 적합한 회귀 분석을 테스트하고 싶습니다. 내 종속 변수는 개수이며 많은 0이 있습니다.
그리고 사용할 모델 및 패밀리 (poisson 또는 quasipoisson 또는 0으로 부풀린 poisson 회귀)를 결정하고 가정을 테스트하는 방법을 결정하는 데 도움이 필요합니다.
- 포아송 회귀 : 내가 이해하는 한, 종속 변수 평균 = 분산이라는 강한 가정이 있습니다. 이것을 어떻게 테스트합니까? 그들은 얼마나 가까이 있어야합니까? 무조건 또는 조건부 평균 및 분산이 여기에 사용됩니까? 이 가정이 유지되지 않으면 어떻게해야합니까?
- 분산이 평균보다 큰 경우 과대 산포가 발생하고이를 처리하는 잠재적 인 방법은 더 독립적 인 변수 또는 family = quasipoisson을 포함한다는 것을 읽었습니다. 이 배포판에 다른 요구 사항이나 가정이 있습니까? (1) 또는 (2)가 더 잘 맞는지 확인하기 위해 어떤 테스트를 사용
anova(m1,m2)
합니까? - 또한 과분 산이 나타날 때 음 이항 분포를 사용할 수 있음을 읽었습니다. R에서 어떻게해야합니까? quasipoisson과의 차이점은 무엇입니까?
제로 팽창 된 포아송 회귀 분석 : vuong 테스트를 사용하면 어떤 모델이 더 적합한 지 확인합니다.
> vuong (model.poisson, model.zero.poisson)
그 맞습니까? 무 팽창 회귀에는 어떤 가정이 있습니까?
UCLA의 Academic Technology Services, Statistical Consulting Group 에는 제로 팽창 된 포아송 회귀에 대한 섹션이 있으며 제로 팽창 된 모델 (a)을 표준 포아송 모델 (b)과 비교하여 테스트합니다.
> m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
> m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
> vuong(m.a, m.b)
| persons
첫 번째 모델 의 일부가 무엇인지, 왜 이러한 모델을 비교할 수 없는지 이해하지 못합니다 . 나는 회귀가 동일하고 다른 가족을 사용하기를 기대했습니다.