REML 대 ML stepAIC


10

AIC를 사용하여 최상의 모델을 선택하여 혼합 모델 분석을 실행하는 방법에 대한 문헌을 찾으려고 노력한 후 압도적이라고 생각합니다. 내 데이터가 그렇게 복잡하다고 생각하지는 않지만 내가 한 일이 올바른지 확인한 다음 진행 방법에 대한 조언을 찾고 있습니다. REML 또는 ML을 사용해야하는 경우 lme 또는 lmer를 사용 해야하는지, 그중 하나를 사용 해야하는지 확실하지 않습니다.

나는 선택의 가치가 있고 어떤 공변량이 그 가치에 가장 큰 영향을 미치고 예측을 허용하는지 알고 싶다. 여기에 내가 작업하고있는 테스트를위한 예제 데이터와 코드가 있습니다.

ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)

다양한 조합과 최대 양방향 상호 작용 항 으로이 데이터를 탐색하는 ~ 19 개의 모델이 있지만 항상 임의의 효과로 ID를 사용하고 종속 변수로 comp1을 사용합니다.

  • Q1. 어느 것을 사용해야합니까? lme 또는 lmer? 그게 그렇게 중요한 건가?

이 두 가지 모두에서 ML 또는 REML을 사용할 수있는 옵션이 있으며 ML과 AIC를 사용하여 크게 다른 답변을 얻습니다. 비슷한 AIC 값을 가진 6 가지 모델로 끝나고 모델 조합은 단순히 의미가 없지만 REML 가장 가능성이 높은 모델 중 2 개가 최고입니다. 그러나 REML을 실행할 때 더 이상 anova를 사용할 수 없습니다.

  • Q2. ANOVA와 함께 사용하기 때문에 REML보다 ML을 사용하는 주된 이유는 무엇입니까? 이것은 나에게 분명하지 않습니다.

여전히 stepAIC을 실행할 수 없거나 19 가지 모델을 좁힐 다른 방법을 모릅니다.

  • Q3. 이 시점에서 stepAIC를 사용하는 방법이 있습니까?

3
Q2의 경우, 고정 효과가 변경 될 때 REML을 사용한 비교가 유효하지 않으므로 ML이 필요합니다. 가능한 유용한 관련 질문은 다음과 같습니다. stats.stackexchange.com/a/16015/3601
Aaron left Stack Overflow

@Aaron 나는 그 질문을 전에 보았지만 여전히 혼란 스러웠다. 임의 효과가 변경 될 때 REML 만 "작동"합니까? ML 대 REML을 충분히 이해하지 못합니다. 고마워, 내 질문 중 하나에 도움이됩니다!
Kerry

네 맞습니다. 모델을 비교할 때 REML은 모델에 동일한 고정 효과가있는 경우에만 사용해야합니다. 답변이 아래로 확장되었습니다.
Aaron은 스택 오버플로를

답변:


16

Q1. 어느 것을 사용해야합니까? lme 또는 lmer? 그게 그렇게 중요한 건가? 어느 쪽이든 괜찮습니다. 그들은 당신에게 맞는 것을 줄 것입니다. lmep- 값을 줄 lmer것이고, 그렇지 않을 것입니다. 그러나 그것은 내가 여기에 들어가고 싶은 것 이상입니다. 가장 유명한 참조는 R-도움말 메일 링리스트 더그 베이츠의 게시물 중 하나입니다 여기 .

(주의 : 그들은 사용 약간 다른 알고리즘이 너무 잠재적으로 어떤 계산이 어려운 하나 또는 다른 더 잘 할 수도 있지만, 사람들은 실제로 매우 드문 경우에, 실제로, 잘못된 모형의 어떤 종류의 가능성이 가장 높은 지점이있다 할 참조하십시오. 완전히 다른 lmer () 및 lme ()의 결과 )

Q2. ANOVA와 함께 사용하기 때문에 REML보다 ML을 사용하는 주된 이유는 무엇입니까? 이것은 나에게 분명하지 않습니다. 고정 효과가 변경되면 REML을 사용한 비교가 유효하지 않으므로 ML이 필요합니다. 가능한 유용한 관련 질문은 https://stats.stackexchange.com/a/16015/3601 입니다. 위의 의견에서 귀하의 질문에 대답하기 위해 모델을 비교할 때 REML은 모델에 동일한 고정 효과가있는 경우 (즉, 임의 효과 만 변경되는 경우) 사용해야합니다. REML 가능성은 모델에 어떤 고정 효과가 있는지에 따라 달라 지므로 고정 효과가 변경되면 비교할 수 없습니다. REML은 일반적으로 랜덤 효과에 대한 더 나은 추정치를 제공하는 것으로 간주되므로 일반적인 추론은 최종 추론 및보고에 REML을 사용하여 최상의 모델을 맞추는 것입니다.

Q3. 이 시점에서 stepAIC를 사용하는 방법이 있습니까? 상황에 맞는 19 가지 모델을 비교하려면 AIC를 모두 비교하십시오. 단계적 절차를 전혀 사용할 이유가 없습니다. 단계별 절차는 일반적으로 최상의 모델을 찾을 수 있다고 보장하지 않기 때문에 일반적으로 구식으로 간주되며 컴퓨터를 통해 많은 모델을 쉽게 비교할 수 있습니다.


1

더 깊이 파고 들면서, 나는 Aaron이 제공 한 링크를 뒷받침하는 이러한 자료를 발견했으며 나처럼 시작하는 사람들에게 좋은 독서 자료입니다. 예를 들어 http://lme4.r-forge.r-project.org/ 에 링크 된 장은 동일한 프로젝트 페이지 에서 슬라이드 링크 http://lme4.r-forge.r-project.org/slides/ 를 확인 하십시오. . 많은 단기 과정에는 예제 R 코드가있어 큰 도움이되었습니다.
또한 Bolker 박사의이 짧은 답변 http://r.789695.n4.nabble.com/lme-vs-lmer-how-do-they-differ-td2534332.html

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.