포아송 회귀 가정 및 R에서 검정을 테스트하는 방법


11

데이터에 가장 적합한 회귀 분석을 테스트하고 싶습니다. 내 종속 변수는 개수이며 많은 0이 있습니다.

그리고 사용할 모델 및 패밀리 (poisson 또는 quasipoisson 또는 0으로 부풀린 poisson 회귀)를 결정하고 가정을 테스트하는 방법을 결정하는 데 도움이 필요합니다.

  1. 포아송 회귀 : 내가 이해하는 한, 종속 변수 평균 = 분산이라는 강한 가정이 있습니다. 이것을 어떻게 테스트합니까? 그들은 얼마나 가까이 있어야합니까? 무조건 또는 조건부 평균 및 분산이 여기에 사용됩니까? 이 가정이 유지되지 않으면 어떻게해야합니까?
  2. 분산이 평균보다 큰 경우 과대 산포가 발생하고이를 처리하는 잠재적 인 방법은 더 독립적 인 변수 또는 family = quasipoisson을 포함한다는 것을 읽었습니다. 이 배포판에 다른 요구 사항이나 가정이 있습니까? (1) 또는 (2)가 더 잘 맞는지 확인하기 위해 어떤 테스트를 사용 anova(m1,m2)합니까?
  3. 또한 과분 산이 나타날 때 음 이항 분포를 사용할 수 있음을 읽었습니다. R에서 어떻게해야합니까? quasipoisson과의 차이점은 무엇입니까?
  4. 제로 팽창 된 포아송 회귀 분석 : vuong 테스트를 사용하면 어떤 모델이 더 적합한 지 확인합니다.

    > vuong (model.poisson, model.zero.poisson)

    그 맞습니까? 무 팽창 회귀에는 어떤 가정이 있습니까?

  5. UCLA의 Academic Technology Services, Statistical Consulting Group 에는 제로 팽창 된 포아송 회귀에 대한 섹션이 있으며 제로 팽창 된 모델 (a)을 표준 포아송 모델 (b)과 비교하여 테스트합니다.

    > m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
    > m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
    > vuong(m.a, m.b)

| persons첫 번째 모델 의 일부가 무엇인지, 왜 이러한 모델을 비교할 수 없는지 이해하지 못합니다 . 나는 회귀가 동일하고 다른 가족을 사용하기를 기대했습니다.

답변:


8

엑스¯에스2에프(1,1)

이 테스트는 공변량을 무시하므로 해당 상황에서과 분산을 확인하는 가장 좋은 방법은 아닙니다.

또한이 테스트는 0으로 팽창 된 가설에 비해 약할 수 있습니다.

3) 음극의 R의 이항 : 사용 glm.nb로부터 MASS패키지 또는 사용 zeroinfl으로부터 함수 pscl음 이항 링크를 사용하여 패키지.

4) 지퍼 (제로 팽창 된 포아송)는 혼합 모델입니다. 대상이 그룹 A (0이 확실한 경우) 또는 그룹 B (개수가 포아송 또는 음 이항 분포)에 속하는 이진 결과가 있습니다. 관찰 된 0은 그룹 A의 대상 + 방금 운이 좋은 그룹 B의 대상으로 인한 것입니다. 모형의 두 측면은 공변량에 따라 다를 수 있습니다. 그룹 구성원은 로지스틱처럼 모델링되고 (로그 확률은 공변량에서 선형 임) 푸 ​​아송 부분은 일반적인 방식으로 모델링됩니다. 로그 평균은 공변량에서 선형입니다. 따라서 물류 (특정 0 부분)에 대한 일반적인 가정과 포아송에 대한 일반적인 가정이 필요합니다. 다시 말해, zip 모델은과 분산 문제를 해결하지 못합니다. 단지 0의 큰 곰팡이 만 치료합니다.

5) 데이터 세트가 무엇인지 모르고 참조를 찾을 수 없습니다. zeroinfl은 포아송 부분과 이진 (확실한 0 또는 그렇지 않은) 부분 모두에 대한 모델이 필요합니다. 특정 0 부분이 두 번째가됩니다. 그래서 ma는 사람이 특정 0인지 아닌지는 "사람"에 달려 있다고 말하고 있습니다. 주제가 특정 0이 아니라고 가정하면 수는 야영 자와 어린이의 기능입니다. 다시 말해 log (mean)은 0 카운트를 필요로하지 않는 대상에 대한 야영 자와 아동의 선형 함수입니다.

mb는 캠퍼와 자식의 관점에서 일반적인 선형 모델입니다. 둘 다 고정 된 효과라고 가정합니다. 링크 기능은 포아송입니다.


감사합니다! 빠른 질문 : R에서 family = poisson을 사용하여 glm에서 Nagelkerke와 같은 r ^ 2 또는 pseudo-r ^ 2를 생성하는 방법이 있습니까? 감사합니다!
Torvon

0
  1. 도서관 (과거)

stat.desc (dep_var)-평균과 분산이 같은지 살펴보십시오. 여기에서 벡터의 0 %를 계산할 수도 있습니다.


3
사이트에 오신 것을 환영합니다. 이것은 답변보다 설명과 비슷합니다. 또한, 올바른 철자를 사용하는 것이 좋습니다. 이것은 문자 메시지가 아니며이 사이트를 읽는 많은 사람들이 영어를 2, 3, 또는 .... 언어로 사용합니다.
Peter Flom

3
이 빠른 답변을 개선하기 위해 노력하십시오.
chl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.