저는 최근에 일반화 선형 혼합 모형에 대해 배우기 시작했고 R을 사용하여 그룹 구성원을 고정 또는 무작위 효과로 취급하는 데 어떤 차이점이 있는지 살펴 보았습니다. 특히, 나는 여기에서 논의 된 데이터 세트의 예를보고있다 :
http://www.ats.ucla.edu/stat/mult_pkg/glmm.htm
http://www.ats.ucla.edu/stat/r/dae/melogit.htm
이 튜토리얼에서 설명했듯이 Doctor ID의 효과는 훌륭하며 임의의 인터셉트가있는 혼합 모델이 더 나은 결과를 줄 것으로 기대했습니다. 그러나 두 방법의 AIC 값을 비교하면이 모델이 더 나빠집니다.
> require(lme4) ; hdp = read.csv("http://www.ats.ucla.edu/stat/data/hdp.csv")
> hdp$DID = factor(hdp$DID) ; hdp$Married = factor(hdp$Married)
> GLM = glm(remission~Age+Married+IL6+DID,data=hdp,family=binomial);summary(GLM)
Call:
glm(formula = remission ~ Age + Married + IL6 + DID, family = binomial,
data = hdp)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.5265 -0.6278 -0.2272 0.5492 2.7329
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.560e+01 1.219e+03 -0.013 0.990
Age -5.869e-02 5.272e-03 -11.133 < 2e-16 ***
Married1 2.688e-01 6.646e-02 4.044 5.26e-05 ***
IL6 -5.550e-02 1.153e-02 -4.815 1.47e-06 ***
DID2 1.805e+01 1.219e+03 0.015 0.988
DID3 1.932e+01 1.219e+03 0.016 0.987
[...]
DID405 1.566e+01 1.219e+03 0.013 0.990
DID405 1.566e+01 1.219e+03 0.013 0.990
DID406 -2.885e-01 3.929e+03 0.000 1.000
DID407 2.012e+01 1.219e+03 0.017 0.987
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 10353 on 8524 degrees of freedom
Residual deviance: 6436 on 8115 degrees of freedom
AIC: 7256
Number of Fisher Scoring iterations: 17
> GLMM = glmer(remission~Age+Married+IL6+(1|DID),data=hdp,family=binomial) ; m
Generalized linear mixed model fit by the Laplace approximation
Formula: remission ~ Age + Married + IL6 + (1 | DID)
Data: hdp
AIC BIC logLik deviance
7743 7778 -3867 7733
Random effects:
Groups Name Variance Std.Dev.
DID (Intercept) 3.8401 1.9596
Number of obs: 8525, groups: DID, 407
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.461438 0.272709 5.359 8.37e-08 ***
Age -0.055969 0.005038 -11.109 < 2e-16 ***
Married1 0.260065 0.063736 4.080 4.50e-05 ***
IL6 -0.053288 0.011058 -4.819 1.44e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Correlation of Fixed Effects:
(Intr) Age Marrd1
Age -0.898
Married1 0.070 -0.224
IL6 -0.162 0.012 -0.033
> extractAIC(GLM) ; extractAIC(GLMM)
[1] 410.000 7255.962
[1] 5.000 7743.188
따라서 내 질문은 다음과 같습니다.
(1) 두 기능이 제공하는 AIC 값을 비교하는 것이 적절합니까? 그렇다면 고정 효과 모델이 더 나은 이유는 무엇입니까?
(2) 고정 또는 무작위 효과가 더 중요한지 식별하는 가장 좋은 방법은 무엇입니까 (즉, 의사로 인한 변동성이 환자 특성보다 더 중요하다는 것을 정량화하는 방법은 무엇입니까?
DID
으로 모두 고정 효과 와 2 차 모델에서 임의의 절편. 또한, 1 차 모델에서 고정 효과로 사용한다는 것은이 2 개의 선택DID
이 포함되어야하는지 여부가 아니라 의 효과에 대해 생각할 수있는 방법이라는 것을 의미합니다 . 다른 쪽지에, 나는 당신이 아이템을 가지고 있음을 알았습니다 (2); (1) 어딘가에 항목이 있다는 의미입니까?