Poisson GLM 결과에서 모수 추정값을 해석하는 방법 [닫기]


14
Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)

Deviance Residuals:
    Min      1Q   Median     3Q    Max
-3.7422 -1.0257   0.0027 0.7169 3.5347

Coefficients:
              Estimate Std.Error z value Pr(>|z|)
(Intercept)   3.144257  0.218646  14.381  < 2e-16 ***
riverWatauga -0.049016  0.051548  -0.951  0.34166
pH            0.086460  0.029821   2.899  0.00374 **
temp         -0.059667  0.009149  -6.522  6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21

위의 표에서 각 모수 추정값을 해석하는 방법을 알고 싶습니다.



6
이 질문은 어떤 형태의 지능적 질문도없이 R 출력을 설명하는 것이기 때문에 주제가 아닌 것 같습니다. 이것은 "내 컴퓨터 출력을 덤프하고 당신은 나를 위해 통계 분석을 실행합니다"카테고리입니다.
Xi'an

1
분산 파라미터는 모델에 문제가 있음을 나타냅니다. 아마도 quasipoisson 분포를 대신 사용하는 것이 좋습니다. 나는 당신의 매개 변수 추정치가 급격히 변할 것이고 내 해석도 변할 것이라고 확신합니다. "plot (model)"을 실행하면 일부 잔차 그림이 표시되며 실제 모델 해석을 시작하기 전에 원치 않는 패턴에 대해이 그림을 살펴보십시오. 모델의 적합도를 빠르게 나타 내기 위해 visreg 패키지의 "visreg (modelfit)"을 사용할 수도 있습니다
Robbie

3
@ 시안 (Xi'an), 질문은 드문 & 필수 편집이지만 주제가 아닌 것으로 생각하지 않습니다. R의 lm () 출력 해석이항 회귀에 대한 R의 출력 해석과 같은 주제로 간주되지 않는 다음 질문을 고려하십시오 . 그러나 중복 된 것으로 보입니다 .
gung-Monica Monica 복원

2
이것은 포아송 회귀 분석에서 계수를 해석하는 방법 의 복제본 입니까? 연결된 실을 읽으십시오. 읽은 후에도 여전히 궁금한 점이 있으면 여기로 돌아와서 배운 내용과 알아야 할 내용을 설명하기 위해 질문을 편집하십시오. 우리는 이미 도움이되지 않은 다른 자료를 복제하지 않고도 필요한 정보를 제공 할 수 있습니다 당신.
gung-Monica Monica 복원

답변:


28

나는 당신의 질문의 제목이 당신이 요구하는 것을 정확하게 포착한다고 생각하지 않습니다.

GLM은 매우 광범위한 모델 클래스이므로 GLM에서 매개 변수를 해석하는 방법에 대한 질문은 매우 광범위합니다. GLM 은 지수 패밀리에서 알려진 분포를 따르는 것으로 가정 되는 반응 변수 를 모델링하고 E [ y 와 같은 반전 할 수없는 함수 g를 선택 했음을 상기하십시오. ygJ 예측 변수 x에 대한 x ] = g - 1 ( x 0 + x 1 β 1 + + x J β J ) . 이 모델에서는, 특정 파라미터의 해석 β j는 변화율 인 g ( Y ) 에 대한 X의 J는 . μ E 정의 [ y

E[y|x]=g1(x0+x1β1++xJβJ)
Jxβjg(y)xjηxβ는 표기법을 깨끗하게 유지합니다. 그런 다음 모든j{1,,J}에 대해 β j =μE[y|x]=g1(x)ηxβj{1,,J} 지금 정의전자J를(A)의 벡터로J-1제로 및 하나의1에서J, 예를 들면 만약 그래서, 위치 차를J=5다음전자(3)=(0,0,1,0,0). 그런 다음 βj=g(E [ y
βj=ηxj=g(μ)xj.
ejJ11jJ=5e3=(0,0,1,0,0)
βj=g(E[y|x+ej])g(E[y|x])

βjηxj

E[y|x]xj=μxj=dμdηηxj=μηβj=dg1dηβj
E[y|x+ej]E[y|x]Δjy^=g1((x+ej)β)g1(xβ)

gβjηyxjyxjg1(β)


yPoisson(λ)g=ln

μxj=dg1dηβjg(μ)=ln(μ)g1(η)=eηdeηdη=eη

μxj=E[y|x]xj=ex0+x1β1++xJβJβj

마침내 유형의 것을 의미합니다.

xjy^y^βj

참고 :이 근사값은 필요한 정밀도에 따라 0.2만큼 큰 변화에 실제로 작동 할 수 있습니다.

Δjy^=ex0+x1β1++(xj+1)βj++xJβJex0+x1β1++xJβJ=ex0+x1β1++xJβJ+βjex0+x1β1++xJβJ=ex0+x1β1++xJβJejβex0+x1β1++xJβJ=ex0+x1β1++xJβJ(ejβ1)

xjy^y^(ejβ1)

여기에 주목해야 할 중요한 세 가지가 있습니다.

  1. 예측 변수의 변경 효과는 반응 수준에 따라 다릅니다.
  2. 예측 변수의 가산 적 변화는 반응에 곱하기 효과를줍니다.
  3. 계수를 읽는 것만으로 계수를 해석 할 수는 없습니다 (머리에 임의의 지수를 계산할 수없는 경우).

lny^y^(e0.091) y^e0.091.09


@ssdecontrol에서 몇 가지 조정을했습니다. 나는 그들이 당신의 게시물을 좀 더 이해하기 쉽게 만들 것이라고 생각하지만, 마음에 들지 않으면 사과와 함께 다시 게시하십시오.
gung-복직 모니카

나는 당신이 내 대답에서 그것을 알아낼 수 없으며 분명히 대답을 수정해야합니다. 아직도 혼란스러워하는 것은 무엇입니까?
shadowtalker

단지 선형 회귀 같은 식으로 그 번호를 연결
shadowtalker

1
E[y|x]xyxjxj

2
그리고 그것을 너무 생각하지 마십시오. GLM의 모든 부분을 이해하면 여기에서의 조작은 미적분학 원리를 직접 적용하는 것입니다. 관심있는 변수와 관련하여 미분을 취하는 것만큼이나 간단합니다.
shadowtalker

3

내 제안은 두 강의 조합과 각 공변량의 두 세 가지 값으로 구성된 작은 격자를 만든 다음 predict격자와 함께 함수 를 사용하는 것입니다 newdata. 그런 다음 결과를 그래프로 표시하십시오. 모델이 실제로 예측하는 값을 보는 것이 훨씬 더 명확합니다. 예측을 원래 측정 척도 ( type = "response") 로 역변환 할 수도 있고 원하지 않을 수도 있습니다 .


1
이 접근 방식을 좋아하는 한 (항상 그렇게 함) 이해를 구축하는 데 비생산적이라고 생각합니다.
shadowtalker
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.