Modeling Count Data 과정의 학생들 중 한 명이이 사이트를 추천했습니다 . 부정적인 이항 모델에 대해, 특히 분산 통계 및 분산 매개 변수와 관련하여 많은 잘못된 정보가있는 것으로 보입니다.
카운트 모델의 추가 분산을 나타내는 분산 통계량은 Pearson 통계량을 잔류 DOF로 나눈 값입니다. 는 위치 또는 모양 매개 변수입니다. 카운트 모델의 경우 스케일 파라미터는 1로 설정됩니다. R 및 θ 는 분산 파라미터 또는 보조 파라미터입니다. 필자는이 책을 제 1 권 네거티브 이항 회귀 (2007, Cambridge University Press) 에서 이질성 매개 변수라고 불렀지 만 2011 년 제 2 판에서는 분산 매개 변수라고 부릅니다. 나는 앞으로 나올 책인 Modeling Count Data (Cambridge) 에서 NB 모델의 다양한 용어에 대한 완벽한 근거를 제시 한다. 7 월 15 일까지 판매 (문고)해야합니다. μglm
glm.nb
θ
glm.nb
그리고 glm
그들이 분산 매개 변수를 정의하는 방법에 예외적이다. 분산은 직접 파라미터화인μ+αμ2보다 θ . 이는 NB가 SAS, Stata, Limdep, SPSS, Matlab, Genstat, Xplore 및 대부분의 모든 소프트웨어에서 모델링되는 방식입니다. 결과를 다른 소프트웨어 결과와비교할 때이를 기억하십시오. (S-plus에서 온)의 저자와μ+μ2θμ+αμ2glm.nb
glm
glm.nb
McCullagh & Nelder와 간접적 인 관계를 맺었음에도 불구하고 1972 년 GLM의 공동 설립자 인 Nelder는 1993 년 Genstat에 kk 시스템 애드온을 작성하여 직접 관계가 바람직하다고 주장했습니다. 그와 그의 아내는 1993 년 초부터 그가 죽기 전까지 애리조나에서 2 년마다 저와 제 가족을 방문했습니다. Stata 및 Xplore 소프트웨어와 1994 년 SAS 매크로에 대해 1992 년 말에 작성한 glm 프로그램과 직접 관계를 맺었 기 때문에이를 철저히 논의했습니다.
CRAN nbinomial
의 msme 패키지 에 있는 기능을 통해 사용자는 직접 (기본값) 또는 간접 (옵션으로 glm.nb를 복제) 매개 변수화를 사용하고 Pearson 통계량 및 잔차를 출력에 제공 할 수 있습니다. 출력은 또한 분산 통계량을 표시하고, 사용자가 (또는 θ )를 파라미터 화하여 분산에 대한 파라미터 추정치를 제공합니다. 이를 통해 어떤 예측 변수가 모형의 추가 분산에 추가되는지 평가할 수 있습니다. 이 유형의 모델은 일반적으로 이종 음 이항이라고합니다. 새 책이 나오기 전에 함수를 COUNT 패키지에 넣고 그래픽을위한 여러 가지 새로운 기능과 스크립트를 추가 하겠습니다 . αθnbinomial