family = Gamma를 사용하여 GLM에서 매개 변수를 해석하는 방법


21

감마 분포 종속 변수가있는 GLM의 매개 변수 해석에 관한 질문이 있습니다. 이것이 로그 링크와 함께 R이 내 GLM에 대해 반환하는 것입니다.

Call:
glm(formula = income ~ height + age + educat + married + sex + language + highschool, 
    family = Gamma(link = log), data = fakesoep)

Deviance Residuals: 
       Min        1Q    Median        3Q       Max  
  -1.47399  -0.31490  -0.05961   0.18374   1.94176  

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  6.2202325  0.2182771  28.497  < 2e-16 ***
height       0.0082530  0.0011930   6.918 5.58e-12 ***
age          0.0001786  0.0009345   0.191    0.848    
educat       0.0119425  0.0009816  12.166  < 2e-16 ***
married     -0.0178813  0.0173453  -1.031    0.303    
sex         -0.3179608  0.0216168 -14.709  < 2e-16 ***
language     0.0050755  0.0279452   0.182    0.856    
highschool   0.3466434  0.0167621  20.680  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Gamma family taken to be 0.1747557)

Null deviance: 757.46  on 2999  degrees of freedom
Residual deviance: 502.50  on 2992  degrees of freedom
AIC: 49184

매개 변수를 어떻게 해석합니까? exp(coef())모델을 계산 하면 절편에 대해 ~ 500을 얻습니다. 이제 다른 모든 변수가 일정하게 유지된다면 기대 수입을 의미하지는 않습니까? 평균 또는 mean(age)~ 2000에 있기 때문에 공변량 계수의 방향과 값을 해석하는 방법에 대한 단서가 없습니다.


6
다른 모든 변수가 단순히 회귀와 마찬가지로 정확히 0 이 아니라면 500은 예상 수입에 가깝습니다 .
Glen_b-복지국 모니카

@Glen_b 계수의 지수가 설명 변수에 변화가있을 때 소득에 대한 곱셈 효과 인 경우 왜 수입이 예상됩니까?
tatami

논의중인 경우는 모든 설명 변수가 0 일 때 조건부 평균입니다.
Glen_b-복지국 Monica

답변:


25

로그 링크 감마 GLM 사양은 지수 회귀와 동일합니다.

이자형[와이|엑스,]=특급(α+β엑스+γ)=와이^

이것은 . 이는 의미가없는 값이 아닙니다 (사전에 변수를 중앙에 0으로 두지 않는 한).이자형[와이|엑스=0,=0]=특급(α)

모델을 해석하는 방법은 최소한 세 가지가 있습니다. 하나의 예상 값의 유도체 수행하는 주어진 X 에 대해서 X :와이엑스엑스

E[y|x,z]x=exp(α+βx+γz)β=y^β

이 수량에 따라 달라집니다 Z 는 평균에이 평가 중 하나를 할 수 있습니다, / 중간 / 모달 또는 대표 값 XZ , 또는의 평균 소요 Y를β 샘플을 이상. 이를 둘 다 한계 효과라고합니다. 이 도함수는 연속 변수 (높이와 같은)에 대해서만 의미가 있으며 y 에 대한 x 의 작은 변화의 추가 효과를 알려줍니다 .xzxzy^βxy

경우 (섹스와 같은) 바이너리했다, 대신 유한 차이를 계산하는 것이 좋습니다 : E [ Y | Z , X = 1 ] - E [ Y | z , x = 0 ] = exp ( α + β + γ z )exp ( α + γ z ) = exp ( α + γ z )x

E[y|z,x=1]E[y|z,x=0]=exp(α+β+γz)exp(α+γz)=exp(α+γz)(exp(β)1)

이것은 섹스의 무한한 변화를 상상하기 어렵 기 때문에 더 의미가 있습니다. 물론 연속 변수를 사용하여이 작업을 수행 할 수도 있습니다. 이는 작은 단위가 아닌 x 단위 변화로 인한 추가 효과입니다 .엑스

세 번째 방법은 계수를 지수화하는 것입니다. 참고 :

E[y|z,x+1]=exp(α+β(x+1)+γz)=exp(α+βx+β+γz)=exp(α+βx+γz)exp(β)=E[y|z,x]exp(β)

이는 지수 계수를 가산 적으로 곱하기 보다는 곱셈으로 해석 할 수 있음을 의미합니다 . 가 1 씩 변할 때 예상 값에 승수를 제공합니다 .x


1
두 번째 해석을 설명해 주시겠습니까?
다다미

@tatami 나는 이진 경우에 실수를 고쳤다. 이제 더 이해가 되나요?
Dimitriy V. Masterov

2

먼저 잔차를보고 모형이 얼마나 잘 맞는지 확인합니다. 괜찮다면 감마 분포에서 나온 것이라고 믿을만한 이유가 없다면 다른 링크 함수를 사용해보십시오. 감마가 여전히 설득력있게 보이면 통계적으로 중요한 용어는 절편, 신장, 교육, 성별 및 고등학교 (별표 3 개로 표시됨)라고 결론을 내릴 수 있습니다. 그중에서도 표준화되어 있지 않으면 더 이상 말할 수 없습니다 (같은 범위를 가짐).

의견에 대한 답변 : 귀하의 질문을 더 잘 이해하고 있습니다. 당신은 절대적으로 그렇게 할 수 있습니다! 높이가 한 단위 증가하면 exp (0.0082530) -1 ~ = 0.0082530 (exp x = 1 + x 근사 x 작은 x) 근사 소득의 상대적 변화가 발생합니다. 해석하기 매우 쉬운가요?


1
그래서 실제로 매개 변수를 해석 할 수 없습니다. 예를 들어 높이가 1 씩 증가하면 소득이 xy 씩 증가합니까?

1
나는 그것을 곱셈으로 해석해야한다고 믿습니다. exp (Intercept) * exp (height)는 높이가 1 단위 증가한 소득입니다. 그럼에도 감사합니다! :)
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.