선형 혼합 효과 모델에 대해 해석하기 쉽고 적합도 측정 방법은 무엇입니까?


37

현재 R 패키지 lme4를 사용하고 있습니다.

임의의 효과가있는 선형 혼합 효과 모델을 사용하고 있습니다.

library(lme4)
mod1 <- lmer(r1 ~ (1 | site), data = sample_set) #Only random effects
mod2 <- lmer(r1 ~ p1 + (1 | site), data = sample_set) #One fixed effect + 
            # random effects
mod3 <- lmer(r1 ~ p1 + p2 + (1 | site), data = sample_set) #Two fixed effects + 
            # random effects

모델을 비교하기 위해 anova함수를 사용 하고 가장 낮은 AIC 모델에 대한 AIC의 차이점을 살펴보고 있습니다.

anova(mod1, mod2, mod3)

위의 모델 비교에 적합합니다.

그러나 각 모델의 적합도를 해석하는 간단한 방법도 필요합니다. 누구든지 그러한 조치에 경험이 있습니까? 나는 약간의 연구를 해 왔으며 혼합 효과 모델의 고정 효과에 대한 R 제곱에 대한 논문이 있습니다.

  • Cheng, J., Edwards, LJ, Maldonado-Molina, MM, Komro, KA, & Muller, KE (2010). 실제 사람들을위한 실제 종단 데이터 분석 : 충분한 혼합 모델 구축. 의학 통계, 29 (4), 504-520. 도 : 10.1002 / sim.3775
  • Edwards, LJ, Muller, KE, Wolfinger, RD, Qaqish, BF, & Schabenberger, O. (2008). 선형 혼합 모형의 고정 효과에 대한 R2 통계량입니다. 의학 통계, 27 (29), 6137-6157. 도 : 10.1002 / sim.3429

그러나 위의 논문에서 제안 된 것과 같은 수단의 사용에 대해서는 일부 비판이있는 것으로 보인다.

누군가 내 모델에 적용 할 수있는 몇 가지 해석하기 쉽고 적합도를 제안 할 수 있습니까?


2
나는 그 질문을 정말로 좋아하지만 고정 효과가 필요한지 여부를 결정하기 위해 우도 비율 테스트를 사용 하는 것이 권장되는 전략 이 아니라면 faq를 참조하십시오 . 따라서 위의 모델 비교에 적합 하지 않습니다 .
Henrik

감사합니다 Henrik. 나열된 FAQ가 매우 유용합니다. Markov 체인 Monte Carlo 샘플링이 내 모델을 비교하는 좋은 전략이 될 수 있습니다.
mjburns

1
MCMC의 문제점은 예와 같이 간단한 임의 효과 만 가질 수 있다는 것입니다. 나는 더 복잡한 모델에도 적용되기 때문에 켄 워드 로저스의 자유 도와 근사합니다. mixed()afex 패키지의 기능 을 살펴보십시오 ( 개발 버전에는 파라 메트릭 부트 스트랩이 있음 ). 일부 참고 자료는 여기를 참조 하십시오 .
Henrik

헨릭. afex 패키지에서 mixed () 함수를 작동시킬 수있었습니다. afex를 사용하여 모델을 비교할 수있는 방법에 대해 조언 해 주시겠습니까? 한 모델이 다른 모델보다 그럴듯한 지 판단하기 위해 어떤 측정 값을 사용할 수 있습니까? 감사.
mjburns

이것은 쉽게 대답 할 수 없으며, 자세한 내용을 제공하는 별도의 질문을 할 수도 있습니다. 그러나 간단히 말하면, afex는 특정 효과 (또는이 효과를 포함한 더 나은 모델)가 중요한지 평가하도록 도와줍니다. 이를 위해 KRmodcomppackage에서 사용 합니다 pbkrtest. KRmodcomp직접 모델을 비교 하는 데 사용할 수도 있습니다 .
Henrik

답변:


3

선형 혼합 모델에 대한 적합도 측정의 용이성을 해석하는 것과 같은 것은 없습니다 :)

랜덤 효과 맞춤 (mod1)은 ICCICC2(임의 효과로 인한 분산과 잔차 분산 간의 비율 )로 측정 할 수 있습니다 . 사이코 메트릭 R 패키지는 lme 객체에서 추출하는 기능을 포함합니다.

R2고정 효과 (mod2, mod3)를 평가하는 데 사용할 수 있지만 까다로울 수 있습니다. 두 모델이 유사한 R2를 표시하면 하나가 더 "정확한"경우이지만 고정 된 요인 " 랜덤 효과에 더 큰 분산 성분을 빼는 것입니다. 반면에 최상위 모델의 더 큰 R2 (예 : mod3)를 해석하는 것은 쉽습니다. 혼합 모델에 대한 Baayen의 에서 이에 대한 좋은 토론이 있습니다. 또한 튜토리얼은 매우 명확합니다.

가능한 해결책은 각각을 variance component독립적 으로 고려한 다음이를 사용하여 모델을 비교하는 것입니다.


1
Baayen의 장을 말할 때 언급 한 참조가 무엇인지 말씀해 주시겠습니까?
KH Kim

예, 참조가 깨졌습니다!
호기심

이 인용을 찾았지만 확실하지는 않지만 BaayenR
호기심

1
어서와 google-foo는 어디에 있습니까? "baayenCUPstats.pdf에서 검색 : 첫 번째 조회 : sfs.uni-tuebingen.de/~hbaayen/publications/baayenCUPstats.pdf
DWin
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.