혼합 효과와 고정 효과 모델 비교 (임의 효과의 중요성 테스트)


10

긍정적 인 연속적인 세 개의 변수 y와 범주 형인 세 개의 변수가 주어지면 다음 과 같은 두 가지 후보 모델이 있습니다.xz

fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )

fit.fe <- lm( y ~ 1 + x )

어떤 모델이 더 적합한 지 결정하기 위해이 모델들을 비교하고 싶습니다. 어떤 의미 fit.fe에서는 안에 중첩되어 있는 것 같습니다 fit.me. 일반적으로이 일반 시나리오가 유지되면 카이 제곱 테스트를 수행 할 수 있습니다. 에서가 R, 우리는 다음 명령을 사용하여이 테스트를 수행 할 수 있습니다

anova(fit.fe,fit.me)

두 모델 모두 패키지 lmer에서 생성 된 무작위 효과를 포함 lme4하면 anova()명령이 제대로 작동합니다. 경계 매개 변수로 인해 시뮬레이션을 통해 결과 카이-제곱 통계량을 테스트하는 것이 좋습니다. 그럼에도 불구하고 시뮬레이션 절차에서 통계를 계속 사용할 수 있습니다 .

두 모델 모두 고정 된 효과 포함 할 경우이 접근 방식과 관련 anova()명령이 제대로 작동합니다.

그러나 하나의 모델에 임의의 효과가 포함되어 있고 축소 된 모델에 고정 효과 포함 된 경우 위의 시나리오와 같이 anova()명령이 작동하지 않습니다.

보다 구체적으로 다음과 같은 오류가 발생합니다.

 > anova(fit.fe, fit.me)
 Error: $ operator not defined for this S4 class

위의 카이-제곱 접근법을 사용하는 데 문제가 있습니까 (시뮬레이션 사용)? 아니면 이것은 단순히 anova()다른 함수로 생성 된 선형 모델을 처리하는 방법을 모르는 문제 입니까?

즉, 모델에서 파생 된 카이-제곱 통계량을 수동으로 생성하는 것이 적절합니까? 그렇다면 이러한 모델을 비교할 수있는 적절한 자유도는 얼마입니까? 내 계산으로 :

F=((SSEreducedSSEfull)/(pk))((SSEfull)/(np1))Fpk,np1

고정 효과 모델 (경사 및 절편)에서 두 개의 매개 변수와 혼합 효과 모델에서 두 가지 매개 변수 (임의 기울기 및 임의 절편에 대한 분산 매개 변수)를 추정합니다. 일반적으로 가로 채기 매개 변수는 자유도 계산에서 계산되지 않으므로 및 ; 랜덤 효과 파라미터에 대한 분산 파라미터가 자유도 계산에 포함되어야하는지 잘 모르겠습니다. 고정 효과 모수에 대한 분산 추정치는 고려되지 않지만 , 고정 효과에 대한 모수 추정치는 알 수없는 임의의 변수 로 간주되는 반면 고정 효과에 대한 모수 추정치는 없는 상수 로 가정되기 때문이라고 생각 합니다k=1p=k+2=3혼합 효과. 이 문제에 대한 도움을 주셔서 감사합니다.

마지막으로, R이러한 모델을 비교 하는 데 더 적합한 ( 기반) 솔루션이 있습니까?


4
당신이 교체하는 경우 lm()gls()로부터 nlme패키지와 lmer()lme()(로부터 다시 nlme패키지), 다 잘 작동합니다. 그러나 더 간단한 모델의 매개 변수가 매개 변수 공간의 경계에 있으므로 보수적 인 테스트 (너무 큰 p- 값 ) 를 얻을 수 있습니다. 그리고 무작위 효과의 포함 여부는 통계 테스트가 아닌 이론 (예 : 샘플링 계획)을 기반으로 선택해야합니다.
Karl Ove Hufthammer 2014 년

1
모델로 무엇을하고 싶습니까? 한 모델은 어떤 목적에는 더 좋을 수도 있고 다른 모델은 다른 목적에 더 좋을 수도 있습니다. 모든 모델이 잘못되었으므로 어떤 모델이 옳은지는 문제가 아니라 특정 문제에 더 유용합니다.
Kodiologist

1
@Kodiologist 기본적으로 고정 효과에 대한 모수 추정값이 신뢰할 수 있는지 확인하고 싶습니다. 관측치가 독립적이라고 가정하면 표준 오차는 신뢰할 수 없습니다. 또한 무작위 효과의 변수에 대한 진술을하는 것이 좋을 것입니다. 그러나 이것이 꼭 필요한 것은 아니라고 생각합니다.
user9171

2
@ user9171 모델의 파라미터 추정치에서 안정성 (신뢰도)을 확인하는 좋은 방법은 부트 스트랩을 사용하는 것입니다. 두 모델이 공유하는 각 매개 변수에 대한 그래프 부트 스트랩 분포, 매개 변수 및 모델 당 하나의 그래프. 분포가 엄격할수록 안정성이 높아집니다. 매개 변수가 적을수록 각 모수를보다 정확하게 추정 할 수 있으므로 모형이 단순할수록 더 안정적인 추정값을 얻을 수 있습니다.
Kodiologist

답변:


6

기술적으로 매개 변수의 순서를 전환하여 작동시킬 수 있습니다.

> anova(fit.me, fit.fe) 

잘 작동합니다. lmer먼저 생성 한 객체를 전달하면 객체 를 처리하는 방법을 모르는 대신가 anova.merMod호출됩니다 . 보다:anova.lmlmer

?anova.merMod

혼합 모델 또는 고정 모델을 선택하는 것은 모델 선택 문제가 아니라 실험 설계를 고려해야하는 모델링 선택입니다. 자세한 내용은 @BenBolker의 https://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#testing-significance-of-random-effects 를 참조하십시오.

고려 하지 임의 효과의 중요성을 테스트.


+1. 추가 토론과 참고 자료가 포함 된 @BenBolker의 FAQ에 대한 링크를 자유롭게 삽입했습니다.
amoeba
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.