선형 혼합 모델의 예시는 무엇입니까?


17

귀하가 통계 부서의 도서관에 있고 첫 페이지에 다음 그림이있는 책을 발견했다고 가정하십시오.

여기에 이미지 설명을 입력하십시오

아마 이것이 선형 회귀에 관한 책이라고 생각할 것입니다.

선형 혼합 모델에 대해 생각하게 될 그림은 무엇입니까?

답변:


12

대화 sleepstudy를 위해 lme4 패키지 의 데이터 세트를 기반으로 한 다음 그림을 사용했습니다 . 아이디어는 주제별 데이터의 독립 회귀 적합치 (회색) 랜덤 효과 모델의 예측 간의 차이를 설명하는 것이 었습니다 . 특히 (1) 랜덤 효과 모델의 예측 된 값은 수축 추정기이며 (2) 개별 궤적은 공유합니다. 랜덤 절편 전용 모델 (주황색)의 공통 경사. 대상 절편의 분포는 y 축에서 커널 밀도 추정값으로 표시됩니다 ( R 코드 ).

여기에 이미지 설명을 입력하십시오
(밀도 곡선은 관측치가 상대적으로 적기 때문에 관측치 범위를 넘어 확장됩니다.)

좀 더 '종래적인'그래픽은 Doug Bates ( 예 : lme4에 대한 R-forge 사이트에서 사용 가능 ) (예 : 4Longitudinal.R ) 의 다음 그래픽 일 수 있습니다. 여기서 각 패널에 개별 데이터를 추가 할 수 있습니다.

여기에 이미지 설명을 입력하십시오


+1. 좋은 것! 첫 번째 줄거리는 개념적 수준에서 훌륭하다고 생각합니다. 저의 유일한 의견은 표준 "순진한"음모보다 훨씬 더 많은 설명이 필요하다는 것입니다. 청중이 LME 모델과 종단 데이터의 개념에 익숙하지 않으면 음모의 요점을 놓칠 수 있습니다. 그래도 확실한 "통계 대화"를 위해 그것을 기억할 것입니다. (이미 "lme4 책"의 두 번째 줄거리를 이미 두 번 보았습니다. 나는 그다지 감명받지 않았고 지금도 너무 감명받지 않았습니다.)
usεr11852는 Reinstate Monic

@chl : 감사합니다! 제안서 중에서 선택하겠습니다. 한편, +1
ocram 3'13

@ user11852 RI 모델에 대한 나의 이해는 OLS 추정치가 정확하지만 개별 예측도 부정확 할 수 있도록 표준 오류가 (독립성 부족으로 인해) 정확하지 않다는 것입니다. 일반적으로 독립적 인 관측을 가정하여 전체 회귀선을 표시합니다. 그런 다음 이론에 따르면 랜덤 효과의 조건 모드와 고정 효과의 추정값을 결합하면 개체-내 계수의 조건부 모드가 생성되며 통계 단위가 다르거 나 측정이 정확하거나 큰 샘플.
chl

와이|γ(엑스β+γ,σ2나는)와이(엑스β,+σ2나는)

그림을 만드는 R 코드에 대한 링크가 끊어졌습니다. 그림에서 분포를 수직으로 그리는 방법에 관심이 있습니다.
Niels Hameleers

8

따라서 "아주 우아하지 않은"것이지만 R과 함께 임의의 절편과 기울기를 보여주는 것입니다. 여기에 이미지 설명을 입력하십시오

N =100; set.seed(123);


x1 = runif(N)*3; readings1 <- 2*x1 + 1.0 + rnorm(N)*.99;
x2 = runif(N)*3; readings2 <- 3*x2 + 1.5 + rnorm(N)*.99;
x3 = runif(N)*3; readings3 <- 4*x3 + 2.0 + rnorm(N)*.99;
x4 = runif(N)*3; readings4 <- 5*x4 + 2.5 + rnorm(N)*.99;
x5 = runif(N)*3; readings5 <- 6*x5 + 3.0 + rnorm(N)*.99;

X = c(x1,x2,x3,x4,x5);
Y = c(readings1,readings2,readings3,readings4,readings5)
Grouping  = c(rep(1,N),rep(2,N),rep(3,N),rep(4,N),rep(5,N))

library(lme4);
LMERFIT <- lmer(Y ~ 1+ X+ (X|Grouping))

RIaS <-unlist( ranef(LMERFIT)) #Random Intercepts and Slopes
FixedEff <- fixef(LMERFIT)    # Fixed Intercept and Slope

png('SampleLMERFIT_withRandomSlopes_and_Intercepts.png', width=800,height=450,units="px" )
par(mfrow=c(1,2))
plot(X,Y,xlab="x",ylab="readings")
plot(x1,readings1, xlim=c(0,3), ylim=c(min(Y)-1,max(Y)+1), pch=16,xlab="x",ylab="readings" )
points(x2,readings2, col='red', pch=16)
points(x3,readings3, col='green', pch=16)
points(x4,readings4, col='blue', pch=16)
points(x5,readings5, col='orange', pch=16)
abline(v=(seq(-1,4 ,1)), col="lightgray", lty="dotted");        
abline(h=(seq( -1,25 ,1)), col="lightgray", lty="dotted")   

lines(x1,FixedEff[1]+ (RIaS[6] + FixedEff[2])* x1+ RIaS[1], col='black')
lines(x2,FixedEff[1]+ (RIaS[7] + FixedEff[2])* x2+ RIaS[2], col='red')
lines(x3,FixedEff[1]+ (RIaS[8] + FixedEff[2])* x3+ RIaS[3], col='green')
lines(x4,FixedEff[1]+ (RIaS[9] + FixedEff[2])* x4+ RIaS[4], col='blue')
lines(x5,FixedEff[1]+ (RIaS[10]+ FixedEff[2])* x5+ RIaS[5], col='orange') 
legend(0, 24, c("Group1","Group2","Group3","Group4","Group5" ), lty=c(1,1), col=c('black','red', 'green','blue','orange'))
dev.off()

감사! 잠재적 인 새로운 답변을 위해 조금 더 기다립니다. 그러나 나는 이것에 기반을 둘 것입니다.
ocram

오른쪽 하위 그림이 별도의 회귀 선이 각 그룹에 맞는 것처럼 보이기 때문에 나는 당신의 수치에 약간 혼란 스럽습니다. 혼합 모형 적합이 전체 그룹 적합과 다름 아닌 요점이 아닌가? 아마도 그들은 있지만,이 예제에서는 실제로 눈에 띄기가 어렵거나 뭔가 빠졌습니까?
amoeba는 Reinstate Monica

2
예, 계수 가 다릅니다 . 아니; 개별 회귀 분석은 각 그룹에 적합하지 않았습니다. 조건부 맞춤이 표시됩니다. 완벽하게 균형 잡힌 균일 한 디자인에서 차이는 실제로 눈에 띄기 어렵습니다. 예를 들어 그룹 5의 조건부 인터셉트는 2.96이고 그룹 별 독립 인터셉트는 3.00입니다. 변경하는 오차 공분산 구조입니다. chi의 대답도 확인하십시오. 더 많은 그룹이 있지만 아주 적은 경우에도 시각적으로 "매우 다릅니다".
usεr11852는 Reinstate Monic

6

내 일이 아니야

nlmefit 의 Matlab 문서에서 가져온이 그래프 는 임의의 가로 채기 및 기울기의 개념을 아주 분명하게 보여주는 것으로 저를 놀라게 합니다. 아마도 OLS 플롯의 잔차에서이 분산 그룹을 보여주는 것이 아마도 표준 일 것이지만 나는 "해결책"을주지 않을 것입니다.


제안 해 주셔서 감사합니다. 혼합 로지스틱 회귀 분석처럼 보이지만 쉽게 조정할 수 있다고 생각합니다. 더 많은 제안을 기다립니다. 한편 +1. 다시 감사합니다.
ocram

그것은 주로 하나이기 때문에 혼합 로지스틱 회귀처럼 보입니다 ... :) 그것은 실제로 내 마음에 터지는 첫 번째 음모였습니다! 나는 두 번째 대답으로 순수한 R-ish를 줄 것입니다.
usεr11852는 Reinstate Monic
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.