일반화 선형 혼합 모형에서 랜덤 효과의 분산을 해석하는 방법


9

물류 일반화 선형 혼합 모형 (패밀리 = 이항)에서 랜덤 효과 분산을 해석하는 방법을 모르겠습니다.

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

이 수치 결과를 어떻게 해석합니까?

다기관 연구에서 신장 이식 된 환자의 샘플이 있습니다. 환자가 특정 고혈압 치료로 치료받을 확률이 센터마다 같은지 테스트하고있었습니다. 치료받는 환자의 비율은 센터마다 크게 다르지만 환자의 기본 특성의 차이로 인한 것일 수 있습니다. 그래서 나는 patiens의 주요 기능을 조정, 일반 선형 혼합 모델 (물류)을 추정했다. 결과는 다음과 같습니다.

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

정량적 변수가 중심에 있습니다. 나는 절편의 병원 간 표준 편차가 로그 홀수 규모로 0.6554라는 것을 알고 있습니다. 절편이 -1.804469이기 때문에, 로그-홀수 규모로, 평균 연령에 대한 모든 변수 및 면역 치료 A의 평균 값으로 평균 연령의 사람의 고혈압 치료를받을 확률은 14.1 %입니다. . 그리고 이제 해석이 시작됩니다. 랜덤 효과가 정규 분포를 따른다는 가정하에, 대략 95 %의 중심이 평균 0의 2 표준 편차 내에 값을 가질 것으로 예상하므로 평균적인 사람에 대해 처리 될 가능성이 있습니다. 적용 간격이 다음과 같은 센터마다 다릅니다.

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

이 올바른지?

또한 중심 간의 변동성이 통계적으로 유의하면 어떻게 glmer에서 테스트 할 수 있습니까? 나는 Donald Hedeker의 훌륭한 소프트웨어 인 MIXNO와 함께 일 했었고, 여기에는 분산에 대한 추정 오차의 표준 오차가 있습니다. confidene 간격으로 각 센터에서 "평균적인"남자를 치료할 확률을 어떻게 알 수 있습니까?

감사

답변:


10

모델에 대한 추가 정보를 제공하면 가장 도움이되지만, 응답에 관계없이 로그 홀수의 기준값 (예 : 사망률)은 병원마다 다릅니다. 기준선 값 (병원 당 절편 용어)은 기준선 범주 (예 : "처리되지 않은")에서 연속 예측 변수의 0 값으로 사망률의 로그 홀드 (또는 기타)입니다. 이 변형은 로그 홀수 스케일에서 정규 분포로 가정됩니다. 절편의 병원 내 표준 편차는 0.6554입니다. 분산 (표준 편차의 제곱이 아닌 표준 편차의 제곱 )은 다음과 같습니다.0.65542=0.4295.

(질문을 명확하게하거나 모델에 대한 자세한 내용을 추가하면 더 말할 수 있습니다.)

업데이트 : 변형에 대한 해석이 올바른 것 같습니다. 더 정확하게,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

병원 전체에서 치료를받는 기준선 (남성 / 평균 연령 등) 개인의 확률에 대해 95 % 간격 (실제 신뢰 구간은 아니지만 매우 유사)을 제공해야합니다.

랜덤 효과의 중요성을 테스트하기 위해 다양한 선택이 가능합니다 ( 자세한 내용 은 http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html 참조 ). (RE 분포 의 표준 오차는 일반적으로 표본 분포가 왜곡되거나 비정규이기 때문에 신뢰할 수있는 유의성 검정 방법이 아닙니다 .) 가장 간단한 방법은 우도 비 검정을 수행하는 것입니다.

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

2 로의 마지막 나누기는 널값 (즉, RE 분산 = 0)이 실행 가능한 공간의 경계에있을 때 (즉, RE 분산이 <0 일 수 없음) 가능성 비율 테스트가 보수적이라는 사실을 수정합니다.


나는 문제 수정
user2310909

1
감사합니다. 주제에 대해 잘 아는 사람에게 읽어 주셔서 감사합니다.
user2310909
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.