AIC를 사용하여 최상의 모델을 선택하여 혼합 모델 분석을 실행하는 방법에 대한 문헌을 찾으려고 노력한 후 압도적이라고 생각합니다. 내 데이터가 그렇게 복잡하다고 생각하지는 않지만 내가 한 일이 올바른지 확인한 다음 진행 방법에 대한 조언을 찾고 있습니다. REML 또는 ML을 사용해야하는 경우 lme 또는 lmer를 사용 해야하는지, 그중 하나를 사용 해야하는지 확실하지 않습니다.
나는 선택의 가치가 있고 어떤 공변량이 그 가치에 가장 큰 영향을 미치고 예측을 허용하는지 알고 싶다. 여기에 내가 작업하고있는 테스트를위한 예제 데이터와 코드가 있습니다.
ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)
다양한 조합과 최대 양방향 상호 작용 항 으로이 데이터를 탐색하는 ~ 19 개의 모델이 있지만 항상 임의의 효과로 ID를 사용하고 종속 변수로 comp1을 사용합니다.
- Q1. 어느 것을 사용해야합니까? lme 또는 lmer? 그게 그렇게 중요한 건가?
이 두 가지 모두에서 ML 또는 REML을 사용할 수있는 옵션이 있으며 ML과 AIC를 사용하여 크게 다른 답변을 얻습니다. 비슷한 AIC 값을 가진 6 가지 모델로 끝나고 모델 조합은 단순히 의미가 없지만 REML 가장 가능성이 높은 모델 중 2 개가 최고입니다. 그러나 REML을 실행할 때 더 이상 anova를 사용할 수 없습니다.
- Q2. ANOVA와 함께 사용하기 때문에 REML보다 ML을 사용하는 주된 이유는 무엇입니까? 이것은 나에게 분명하지 않습니다.
여전히 stepAIC을 실행할 수 없거나 19 가지 모델을 좁힐 다른 방법을 모릅니다.
- Q3. 이 시점에서 stepAIC를 사용하는 방법이 있습니까?