혼합 효과 모델 (LME4)에서 사례에 대한 경사 추출


13

다음 단락에서 설명한 것처럼 혼합 효과 모델에서 각 개인의 기울기를 추출하고 싶습니다.

혼합 효과 모델은 고정 효과로서 연령, 성별 및 교육 기간에 대한 용어를 포함하여인지 요약 측정에서 개별 변화 경로를 특성화하는 데 사용되었습니다 (Laird and Ware, 1982; Wilson et al., 2000, 2002c) ... 연령, 성별 및 교육의 효과에 대한 조정 후, 혼합 된 모델로부터 잔류, 개별인지인지 감소 기울기 항을 추출 하였다. 이어서, 사람-특이 적, 조정 된 잔류 기울기를 유전 적 연관 분석을위한 정량적 결과 표현형으로 사용 하였다. 이 추정치는 개인의 기울기와 같은 연령, 성별 및 교육 수준의 개인의 예상 기울기의 차이와 동일합니다.

De Jager, PL, Shulman, JM, Chibnik, LB, Keenan, BT, Raj, T., Wilson, RS 등 (2012). 연령 관련인지 감소율에 영향을 미치는 공통 변이체에 대한 게놈 전체 스캔 . 노화의 신경 생물학, 33 (5), 1017.e1–1017.e15.

coef함수를 사용하여 각 개인의 계수를 추출하는 방법을 살펴 봤지만 이것이 올바른 방법인지 확실하지 않습니다.

누구 든지이 작업을 수행하는 방법에 대한 조언을 제공 할 수 있습니까?

#example R code 
library(lme4)
attach(sleepstudy)  
fml <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)
beta <- coef(fml)$Subject
colnames(beta) <- c("Intercept", "Slope")
beta

summary(beta)
summary(fm1)

답변:


29

모델:

library(lme4)
data(sleepstudy)
fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)

이 기능 coef은 개인차를 추출하는 올바른 방법입니다.

> coef(fm1)$Subject
    (Intercept)       Days
308    253.6637 19.6662581
309    211.0065  1.8475834
310    212.4449  5.0184067
330    275.0956  5.6529540
331    273.6653  7.3973908
332    260.4446 10.1951151
333    268.2455 10.2436611
334    244.1725 11.5418622
335    251.0714 -0.2848735
337    286.2955 19.0955694
349    226.1950 11.6407008
350    238.3351 17.0814915
351    255.9829  7.4520286
352    272.2687 14.0032989
369    254.6806 11.3395025
370    225.7922 15.2897513
371    252.2121  9.4791308
372    263.7196 11.7513155

이 값은 고정 효과와 분산 성분 (무작위 효과)의 조합입니다. 당신은 사용할 수 있습니다 summarycoef고정 효과의 계수를 얻기 위해.

> coef(summary(fm1))[ , "Estimate"]
(Intercept)        Days 
  251.40510    10.46729 

절편은 251.4이고 경사 (와 연관된 Days)는 10.4입니다. 이 계수는 모든 과목의 평균입니다. 임의의 효과를 얻으려면을 사용할 수 있습니다 ranef.

> ranef(fm1)$Subject
    (Intercept)        Days
308   2.2585637   9.1989722
309 -40.3985802  -8.6197026
310 -38.9602496  -5.4488792
330  23.6905025  -4.8143320
331  22.2602062  -3.0698952
332   9.0395271  -0.2721709
333  16.8404333  -0.2236248
334  -7.2325803   1.0745763
335  -0.3336936 -10.7521594
337  34.8903534   8.6282835
349 -25.2101138   1.1734148
350 -13.0699598   6.6142055
351   4.5778364  -3.0152574
352  20.8635944   3.5360130
369   3.2754532   0.8722166
370 -25.6128737   4.8224653
371   0.8070401  -0.9881551
372  12.3145406   1.2840295

이 값은 주제의 분산 성분입니다. 모든 행은 하나의 주제에 해당합니다. 값이 고정 효과와의 차이에 해당하기 때문에 각 열의 평균은 0입니다.

> colMeans(ranef(fm1)$Subject)
  (Intercept)          Days 
 4.092529e-13 -2.000283e-13 

이 값은 0과 같으며 편차는 부동 소수점 숫자 표현의 부정확성으로 인한 것입니다.

coef(fm1)$Subject고정 효과를 랜덤 효과 에 공입 한 결과 , 즉 고정 효과 계수가 랜덤 효과에 추가된다. 결과는 개별 절편과 경사입니다.


응답에 감사드립니다. 개별 계수 계산 방법이 정리되었습니다. 그러나 위의 단락에서 잔차를 조정했다고 언급했을 때의 또 다른 질문은 계수에 임의 효과를 포함하는 것과 동일합니까? 아니면 별도의 문제입니까?
Andrews

coef (summary (fm1)) [, "Estimate"]는 모든 주제의 평균을 생성한다고 설명합니다. 나는 가로 채기가 "반응"의 평균 값임을 암시하기 위해 가져 왔지만 'mean (sleepstudy $ Reaction) = 298.5079'입니다. 이것은 선형 회귀에서 절편의 해석이며 혼합 효과 모델의 계수를 이해하려고 노력하고 있습니다 (이와 같이 합산하기 위해 고심하고 있습니다). 왜 가로 채기가 298.5가 아닌가?
svannoy

@svannoy 절편은 모든 공변량이 0 일 때 종속 변수 의 추정값 입니다. 여기서 Days평균이 중심이 아니므로 모형의 절편이의 평균값보다 낮습니다 Reaction. 또한 회귀선이 최적의 선형 적합입니다. 따라서 관측이 반드시이 라인에있는 것은 아닙니다.
Sven Hohenstein

@SvenHohenstein 감사합니다. 그렇다면 단 하나의 범주 형 예측 변수와 편차 코딩 (contr.sum ())을 사용한 OLS 회귀 분석에서 절편이 정확히 대 평균이라고 말하는 것이 정확합니까? 반면 임의의 절편 모델을 사용한 RC 회귀에서는 절편이 추정 된 평균입니까?
svannoy

@svannoy 네, 편차 코딩으로 절편은 OLS 회귀의 대 평균을 반영합니다. 선형 혼합 모형에서 절편은 실제로 추정 된 평균입니다.
Sven Hohenstein
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.