혼합 효과 모델의 허용 된 비교 (주로 무작위 효과)


20

R의 lme4 패키지를 사용하여 혼합 효과 모델링을 살펴 보았습니다. 주로 lmer명령을 사용하고 있으므로 해당 구문을 사용하는 코드를 통해 질문을 제기합니다. 일반적인 쉬운 질문 일 수 있다고 생각합니다 lmer. 동일한 데이터 집합을 기반으로 가능성 비율 을 사용하여 구성된 두 모델을 비교해도 괜찮 습니까? 나는 그 대답이 "아니오"여야한다고 생각하지만, 틀릴 수 있습니다. 랜덤 효과가 동일해야하는지 아닌지에 대한 상충되는 정보를 읽었으며 그 효과의 의미는 무엇입니까? 몇 가지 예를 보여 드리겠습니다. 단어 자극을 사용하여 반복 측정 데이터에서 가져옵니다. 아마도 Baayen (2008) 과 같은 것이 해석에 유용 할 것입니다.

두 가지 고정 효과 예측 변수가있는 모델이 있다고 가정 해 보겠습니다. A와 B라고 부르고 임의의 효과는 ...인지하는 단어와 주제입니다. 다음과 같은 모델을 만들 수 있습니다.

m <- lmer( y ~ A + B + (1|words) + (1|subjects) )

(의도적으로 제외 data =하고 REML = FALSE명확성을 기하기 위해 항상 의미한다고 가정합니다 )

이제 다음 모델 중에서 위의 비율과 비교할 수있는 모델과 그렇지 않은 모델은 무엇입니까?

m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )              
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )                 
m5 <- lmer( y ~ A * B + (1|subjects) )   

본인은 이러한 차이점 중 일부에 대한 해석이 어렵거나 불가능할 수 있음을 인정합니다. 하지만 잠시만 두겠습니다. 여기에 비교 가능성을 배제하는 근본적인 변화가 있는지 알고 싶습니다. 또한 LR이 정상인지 여부와 AIC 비교도 알고 싶습니다.



(이전에 추가 한 [가설 테스트] 태그를 제거했음을 알았습니다. 글쎄, 여러분에게 달려 있지만, 가능성 비율 테스트는 분명히 가설 테스트 절차이며, [혼합 모델] + [가설 테스트] ]는 유익한 태그 조합 인 IMHO입니다. stats.stackexchange.com/questions/tagged/… 참조 )
amoeba는 Reinstate Monica가

LR에서 "test"를 제거하도록 편집되었습니다. LR은 테스트없이 해석 될 수 있으며 AIC와 더 평행을 이뤄 내 실제 의도를 더 잘 따릅니다. 지적 해 주셔서 감사합니다.
John

답변:


13

최대 가능성을 사용하여 이들 중 하나를 AIC와 비교할 수 있습니다. 고정 효과가 동일 ( m1~ m4) 인 경우 REML 또는 ML을 사용하는 것이 좋습니다. 일반적으로 REML이 선호되지만 다른 경우 ML 만 사용할 수 있습니다. 그러나 고정 효과와 임의 효과가 모두 변경 될 때는 일반적으로 해석이 어려우므로 실제로는 한 번에 하나씩 만 변경하는 것이 좋습니다.

분산 성분이 0 인 경우 검정 할 때 일반적인 카이 제곱 근사가 유지되지 않으므로 우도 비율 검정을 사용할 수는 있지만 지저분합니다. 자세한 내용은 Aniko의 답변을 참조하십시오. (Iiko에 대한 질문은 내가했던 것보다 더 신중하게 질문을 읽었 으며이 시점을 놓친 것을 알 수있을 정도로 원래의 대답을주의 깊게 읽었습니다. 감사합니다!)

Pinhiero / Bates는 고전적인 참고 자료입니다. nlme패키지를 설명 하지만 이론은 동일합니다. 글쎄, 대부분 동일합니다. Doug Bates는이 책을 쓴 이후 추론에 대한 권장 사항을 변경했으며 새로운 권장 사항이 lme4패키지에 반영되었습니다 . 그러나 그것은 내가 여기에 들어가고 싶은 것 이상입니다. 더 읽기 쉬운 참조는 Weiss (2005), Modeling Longitudinal Data입니다.


모델 m2 및 m4 또는 m1 및 m3은 우도 비 검정과 비교할 수 없습니다. 중첩 모델이 아닙니다.
매크로

죄송합니다. @Macro! 편집을 참조하십시오.
Aaron-복원 모니카

문제는 모델을 서로 비교하지 않고 모델 m과 비교하는 것입니다. 그럼에도 불구하고 중첩되지 않은 경우에도 AIC 비교를 수행 할 수 있다고 말하는가? 이 질문에 대한 답 은 모순되는 것으로 보입니다.
John

@ 존, 나는 그 답변을 읽었지만 AIC와 토론되지 않은 토론에 대해서는 놓쳤다. 나는 그것이 괜찮다는 것을 확신하지만 대답에서 그 점에 대한보다 정확한 포인터를 줄 수 있습니까?
Aaron-복원 모니카

가능성 비율 검정의 적용 가능성에 대해 틀리거나 적어도 오도하기 때문에 대답을 하향 조정했습니다.
Aniko

12

당신은 분산 구성 요소가 0 (여부를 평가할 때 가능성 비율 테스트를 사용하여 조심해야 mm- m4전형적인 카이 제곱 근사는 않기 때문에) 하지 적용됩니다. 그 이유는 귀무 가설이 이기 때문입니다.σ2=0 이고 모수 공간의 경계에 있기 때문에 고전적인 결과는 적용되지 않기 때문입니다.

mm212χ12+12χ02χ12

그러나 @Aaron이 언급했듯이 많은 전문가들은 이와 같은 우도 비율 테스트를 권장하지 않습니다. 가능한 대안은 정보 기준 (AIC, BIC 등) 또는 LRT 부트 스트랩입니다.

[1] Self, SG & Liang, K. 비표준 조건 하에서의 최대 우도 추정기 및 우도 비율 시험의 점근 적 특성 J. Amer. 통계 학자. Assoc., 1987, 82, 605-610.


1
LR 정보에 감사드립니다. 예제의 모델을 만들 때 LR 경계 문제에 대해서는 실제로 생각하지 않았습니다. 방금 다른 고정 효과와 모델을 비교하는 것과 같이 간단한 사례에 권장 사항이 적용되는 경우 답변에서 명확하지 않은 것으로 나타났습니다 (물론 ML 추정).
John

아니요,이 문제는 고정 효과가 아닌 분산 성분을 테스트 할 때만 발생합니다.
복원 Monica Monica
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.