푸 아송 회귀 분석에서 계수를 해석하는 방법은 무엇입니까?


64

푸 아송 회귀 분석에서 주 효과 (더미 코딩 된 요인의 계수)를 해석하려면 어떻게해야합니까?

다음 예제를 가정하십시오.

treatment     <- factor(rep(c(1, 2), c(43, 41)), 
                        levels = c(1, 2),
                        labels = c("placebo", "treated"))
improved      <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
                        levels = c(1, 2, 3),
                        labels = c("none", "some", "marked"))    
numberofdrugs <- rpois(84, 10) + 1    
healthvalue   <- rpois(84, 5)   
y             <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test          <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)

출력은 다음과 같습니다.

Coefficients:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)       1.88955    0.19243   9.819   <2e-16 ***
numberofdrugs    -0.02303    0.01624  -1.418    0.156    
treatmenttreated -0.01271    0.10861  -0.117    0.907   MAIN EFFECT  
improvedsome     -0.13541    0.14674  -0.923    0.356   MAIN EFFECT 
improvedmarke    -0.10839    0.12212  -0.888    0.375   MAIN EFFECT 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

의 인시던트 비율은 numberofdrugs입니다 exp(-0.023)=0.977. 그러나 더미 변수의 주요 효과를 어떻게 해석합니까?


Poisson GLM 결과에서 모수 추정값을 해석하는 방법에서 유사한 답변을 얻을 수 있습니다 (수학적으로 더 잘 짜여져 있음) .
gung-모니 티 복원

참조 된 질문이 주제를 벗어난 것으로 마감되었다는 것이 흥미 롭습니다. (이것은 주제에 맞지 않다는 데 동의하지 않았을 것입니다. 왜냐하면 모든 답변이 사용자에게 계수 표를 반환 한 통계 프로그램의 출력에도 적용되기 때문에 근거에 가깝다는 데 동의합니다. SO 커뮤니티는 R의 출력 해석을 요구하는 질문에 너무 "꽉"있는 것 같습니다. 코딩 도움말이 필요하다는 제안이 없기 때문에 실제로 StackOverflow에 대한 주제는 아닙니다.
DWin

@DWin, Cross Validated 에 대한 통계 결과 해석이 주제와 맞지 않다고 생각 합니다 . 나는 그 질문을 이것의 복제물로 끝내기로 투표했다. 다른 사람들은 OT에 투표 한 것으로 보인다. 왜냐하면 OP는 "그들의 컴퓨터 출력을 버리고 누군가가 [그들]에 대한 통계 분석을 할 것"이라고 생각했기 때문이다.
gung-복직 모니카

1
@ gung : 나는 그것을 OT라고 부르는 것이 아닌 것이 분명했습니다. 귀하의 의견은 그 시점에서 명확했습니다. (나는 당신과 동의한다고 생각했습니다.) 면밀한 투표에 기재된 "이유"는 종종 다수 또는 복수 결정입니다.
DWin

답변:


56

지수 numberofdrugs계수는 1 단위 씩 증가 healthvalue할 때 추정치를 계산하는 데 사용하는 곱셈 항 numberofdrugs입니다. 범주 형 (인자) 변수의 경우 지수화 된 계수는 해당 변수의 기본 (제 1 요인) 수준에 대한 곱셈 항입니다 (R은 기본적으로 처리 대비를 사용하므로). 는 exp(Intercept)기준 속도, 그리고 다른 모든 평가는 상대가 될 것입니다.

당신의 예에서 예상 healthvalue을 가진 사람에 대한 2약물 "placebo"improvement=="none"(곱셈에 해당하는 등의 특급 내부뿐만 아니라 사용) 할 것입니다 :

 exp( 1.88955 + 2*-0.02303 + 0 + 0 )
 [1] 6.318552

누군가 동안 4약물, "treated""some"개선 것 추정 healthvalue

exp( 1.88955 + 4*-0.02303 + -0.01271 + -0.13541)
[1] 5.203388

부록 : 이것이 "로그 스케일에 가산 적"이라는 의미입니다. "로그 홀수 척도에 대한 첨가물"은 제 선생님 바바라 맥나이트 (Barbara McKnight)가 어떤 종류의 예측을 할 때 로지스틱 회귀에 적용되는 모든 항 계수의 사용 필요성을 강조 할 때 사용한 문구였습니다. 먼저 모든 계수에 공변량 값을 더한 다음 지수를 더합니다. R에서 회귀 객체에서 계수를 반환하는 방법은 일반적으로 coef()추출기 함수 를 사용하는 것입니다 (아래에서 다른 임의의 실현으로 수행됨).

 coef(test)
  #   (Intercept)    numberofdrugs treatmenttreated     improvedsome   improvedmarked 
  #   1.18561313       0.03272109       0.05544510      -0.09295549       0.06248684 

따라서 4약물 로 피험자에 대한 추정치의 계산은 다음 "treated""some"같습니다.

 exp( sum( coef(test)[ c(1,2,3,4) ]* c(1,4,1,1) ) ) 
 [1] 3.592999

이 경우의 선형 예측 변수는 다음의 합이어야합니다.

 coef(test)[c(1,2,3,4)]*c(1,4,1,1) 
 #    (Intercept)    numberofdrugs treatmenttreated     improvedsome 
 #     1.18561313       0.13088438       0.05544510      -0.09295549

이러한 원칙은 계수 테이블을 사용자에게 반환하는 모든 통계 패키지에 적용되어야합니다. 방법과 원칙은 R을 사용할 때보 다 더 일반적입니다.


기본 디스플레이에 '사라짐'이 표시되어 선택된 설명 주석을 복사하고 있습니다.

Q : 계수를 비율로 해석합니다! 감사합니다! – MarkDollar

A : 계수는 비율의 자연 로그입니다. – DWin

Q2 :이 경우, 포아송 회귀 분석에서 지수 계수는 "홀수 비율"이라고도합니까? – 오트

A2 : 아니요. 로지스틱 회귀 분석 인 경우 LHS가 사건 수이고 암시 적 분모가 위험에있는 수인 Poisson 회귀 분석에있을 경우 지수화 된 계수는 "비율"또는 "상대 위험"입니다.


그래서 두 번 투표하자? 멋지다 해석의 R 코드 구현을 제공하면 분류 적성의 세력으로부터 구조를 구할 수 있다고 생각했습니다. OP는 좋은 자체 포함 된 예를 구성했습니다. 추출기 기능을 시연했을 수도 있으므로 그렇게 할 것입니다.
DWin

네, 귀하의 답변을 찬성했습니다. 그리고 여기로 옮겼으며 다시 찬성했습니다. :)
Brandon Bertelsen

지금까지 감사합니다! 나는 인형과 변수 사이의 현실을 알고 있지만 주요 효과를 해석하는 방법에 관심이 있습니다 (마킹했습니다). 예를 들어 더미 처리 된 'exp (-0.012) = 0.99'에 대해 주 효과에서 발생률을 가져와 참조 범주에서 처리로 전환 할 때 healtvalue가 감소하는 비율로 해석 할 수 있습니까? 아니야?
MarkDollar 8:22에

지수화 된 계수는 항상 비율로 해석됩니다. '무엇'대 '무엇'의 비율은 분석 단위에 따라 다릅니다. 'Rate'는 암시 적 숫자와 시간 값을 가지므로 다릅니다. 따라서 용어를 바꾸고 자한다면 아마도 '예'일 것입니다. 가장 좋은 답변은 분석 상황을 완전히 설명하는 것입니다.
DWin

아 알았어이게 내가 알고 싶었어. 따라서 계수를 비율로 해석하십시오! 감사합니다!
MarkDollar
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.