긍정적 인 연속적인 세 개의 변수 y
와 범주 형인 세 개의 변수가 주어지면 다음 과 같은 두 가지 후보 모델이 있습니다.x
z
fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )
과
fit.fe <- lm( y ~ 1 + x )
어떤 모델이 더 적합한 지 결정하기 위해이 모델들을 비교하고 싶습니다. 어떤 의미 fit.fe
에서는 안에 중첩되어 있는 것 같습니다 fit.me
. 일반적으로이 일반 시나리오가 유지되면 카이 제곱 테스트를 수행 할 수 있습니다. 에서가 R
, 우리는 다음 명령을 사용하여이 테스트를 수행 할 수 있습니다
anova(fit.fe,fit.me)
두 모델 모두 패키지 lmer
에서 생성 된 무작위 효과를 포함 lme4
하면 anova()
명령이 제대로 작동합니다. 경계 매개 변수로 인해 시뮬레이션을 통해 결과 카이-제곱 통계량을 테스트하는 것이 좋습니다. 그럼에도 불구하고 시뮬레이션 절차에서 통계를 계속 사용할 수 있습니다 .
두 모델 모두 고정 된 효과 만 포함 할 경우이 접근 방식과 관련 anova()
명령이 제대로 작동합니다.
그러나 하나의 모델에 임의의 효과가 포함되어 있고 축소 된 모델에 고정 효과 만 포함 된 경우 위의 시나리오와 같이 anova()
명령이 작동하지 않습니다.
보다 구체적으로 다음과 같은 오류가 발생합니다.
> anova(fit.fe, fit.me)
Error: $ operator not defined for this S4 class
위의 카이-제곱 접근법을 사용하는 데 문제가 있습니까 (시뮬레이션 사용)? 아니면 이것은 단순히 anova()
다른 함수로 생성 된 선형 모델을 처리하는 방법을 모르는 문제 입니까?
즉, 모델에서 파생 된 카이-제곱 통계량을 수동으로 생성하는 것이 적절합니까? 그렇다면 이러한 모델을 비교할 수있는 적절한 자유도는 얼마입니까? 내 계산으로 :
고정 효과 모델 (경사 및 절편)에서 두 개의 매개 변수와 혼합 효과 모델에서 두 가지 매개 변수 (임의 기울기 및 임의 절편에 대한 분산 매개 변수)를 추정합니다. 일반적으로 가로 채기 매개 변수는 자유도 계산에서 계산되지 않으므로 및 ; 랜덤 효과 파라미터에 대한 분산 파라미터가 자유도 계산에 포함되어야하는지 잘 모르겠습니다. 고정 효과 모수에 대한 분산 추정치는 고려되지 않지만 , 고정 효과에 대한 모수 추정치는 알 수없는 임의의 변수 로 간주되는 반면 고정 효과에 대한 모수 추정치는 알 수 없는 상수 로 가정되기 때문이라고 생각 합니다혼합 효과. 이 문제에 대한 도움을 주셔서 감사합니다.
마지막으로, R
이러한 모델을 비교 하는 데 더 적합한 ( 기반) 솔루션이 있습니까?
lm()
와gls()
로부터nlme
패키지와lmer()
와lme()
(로부터 다시nlme
패키지), 다 잘 작동합니다. 그러나 더 간단한 모델의 매개 변수가 매개 변수 공간의 경계에 있으므로 보수적 인 테스트 (너무 큰 p- 값 ) 를 얻을 수 있습니다. 그리고 무작위 효과의 포함 여부는 통계 테스트가 아닌 이론 (예 : 샘플링 계획)을 기반으로 선택해야합니다.