R이 장착 된 음 이항 회귀 분석에서 세타는 무엇입니까?


26

부정 이항 회귀에 관한 질문이 있습니다. 다음 명령이 있다고 가정합니다.

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(car는 R에서 사용할 수있는 데이터 세트이며이 모델이 의미가 있는지는 신경 쓰지 않습니다.)

내가 알고 싶은 것은 : 변수를 어떻게 해석 할 수 있습니까 theta(에 대한 호출의 맨 아래에 반환 summary). 이것은 네빈 분포의 모양 매개 변수이며 왜도의 척도로 해석 할 수 있습니까?


답변:


17

네, theta음의 이항 분포의 모양 모수이며, 실제로는 왜도의 척도로 해석 할 수 없습니다. 더 정확하게:

  • 왜도는의 값 theta뿐만 아니라 평균에 따라 달라집니다
  • theta그것의 가치는 당신이 비뚤어 짐을 보장 하지 않습니다

음의 이항 회귀에 사용되는 mu/ theta매개 변수화 에서 엉망이되지 않으면 , 왜도는

Skew(NB)=θ+2μθμ(θ+μ)=1+2μθμ(1+μθ)

이와 관련하여, 는 일반적으로 푸 아송 분포와 관련하여과 분산의 척도로 해석됩니다. 음이 항의 분산은 이므로 실제로 기울기 (poke)가 아닌 포아송 ( )에 비해 초과 변동성을 제어합니다 .θμ+μ2/θθμ


지금까지 감사합니다! 이것은 좋은 도움입니다 ... 그러나 : 세타의 높거나 낮은 값을 어떻게 해석 할 수 있습니까? McCaullaughs의 책에 일반화 된 선형 모형에는 k에 대한 해석을하기 위해 anscombe의이 논문에 대한 링크가 있습니다. 그러나 불행히도 나는 실제로 그것을 얻지 못한다. 논문은 claremontmckenna.edu/facultysites/math/FacMember/MOneill/…
MarkDollar

첫 페이지 만 읽으면됩니다. 따라서 세타 (또는 ancomcom의 k)는 네빈 분포의 모양 매개 변수이며 분포가 감마 (k-> 0) 또는 포아송 (k-> 무한대)에 더 가까운 경우 관리합니다. 그러나 그것이 적합하다는 것은 무엇을 의미합니까? 자동차 추정과 같은 세타를 어떻게 해석 할 수 있습니까?
MarkDollar

33

Modeling Count Data 과정의 학생들 중 한 명이이 사이트를 추천했습니다 . 부정적인 이항 모델에 대해, 특히 분산 통계 및 분산 매개 변수와 관련하여 많은 잘못된 정보가있는 것으로 보입니다.

카운트 모델의 추가 분산을 나타내는 분산 통계량은 Pearson 통계량을 잔류 DOF로 나눈 값입니다. 는 위치 또는 모양 매개 변수입니다. 카운트 모델의 경우 스케일 파라미터는 1로 설정됩니다. R 및 θ 는 분산 파라미터 또는 보조 파라미터입니다. 필자는이 책을 제 1 권 네거티브 이항 회귀 (2007, Cambridge University Press) 에서 이질성 매개 변수라고 불렀지 만 2011 년 제 2 판에서는 분산 매개 변수라고 부릅니다. 나는 앞으로 나올 책인 Modeling Count Data (Cambridge) 에서 NB 모델의 다양한 용어에 대한 완벽한 근거를 제시 한다. 7 월 15 일까지 판매 (문고)해야합니다. μglmglm.nb θ

glm.nb그리고 glm그들이 분산 매개 변수를 정의하는 방법에 예외적이다. 분산은 직접 파라미터화인μ+αμ2보다 θ . 이는 NB가 SAS, Stata, Limdep, SPSS, Matlab, Genstat, Xplore 및 대부분의 모든 소프트웨어에서 모델링되는 방식입니다. 결과를 다른 소프트웨어 결과와비교할 때이를 기억하십시오. (S-plus에서 온)의 저자와μ+μ2θμ+αμ2glm.nbglmglm.nbMcCullagh & Nelder와 간접적 인 관계를 맺었음에도 불구하고 1972 년 GLM의 공동 설립자 인 Nelder는 1993 년 Genstat에 kk 시스템 애드온을 작성하여 직접 관계가 바람직하다고 주장했습니다. 그와 그의 아내는 1993 년 초부터 그가 죽기 전까지 애리조나에서 2 년마다 저와 제 가족을 방문했습니다. Stata 및 Xplore 소프트웨어와 1994 년 SAS 매크로에 대해 1992 년 말에 작성한 glm 프로그램과 직접 관계를 맺었 기 때문에이를 철저히 논의했습니다.

CRAN nbinomialmsme 패키지 에 있는 기능을 통해 사용자는 직접 (기본값) 또는 간접 (옵션으로 glm.nb를 복제) 매개 변수화를 사용하고 Pearson 통계량 및 잔차를 출력에 제공 할 수 있습니다. 출력은 또한 분산 통계량을 표시하고, 사용자가 (또는 θ )를 파라미터 화하여 분산에 대한 파라미터 추정치를 제공합니다. 이를 통해 어떤 예측 변수가 모형의 추가 분산에 추가되는지 평가할 수 있습니다. 이 유형의 모델은 일반적으로 이종 음 이항이라고합니다. 새 책이 나오기 전에 함수를 COUNT 패키지에 넣고 그래픽을위한 여러 가지 새로운 기능과 스크립트를 추가 하겠습니다 . αθnbinomial


2
ϕcov(β^)=ϕ(XTŴ^X)1θμθ"모양"-후자는 그것이 모양에 확실히 영향을 미치기 때문에 불합리하다고 생각하지 않습니다.
모모

세타의 범위는 무엇입니까? 세타는 1보다 큰 값이어야합니까?
News_is_Selection_Bias

2

glm 기준 음성 이항 : 여기에 이미지 설명을 입력하십시오

Wikipedia 음수 이항식 'r'은 glm의 'theta'이며 glm 'theta'는 모양 매개 변수입니다. 간단히 말해서, glm의 '세타'는 실패 횟수입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.