복잡한 최대 혼합 모형 (주어진 데이터 및 모형에 대해 가능한 모든 랜덤 효과를 추정)을 다룰 때 그리 드물지 않은 발생 은 일부 랜덤 효과 사이에 완벽하거나 (+1 또는 -1) 거의 완벽한 상관 관계입니다. 토론을 위해 다음 모델 및 모델 요약을 살펴 보겠습니다.
Model: Y ~ X*Cond + (X*Cond|subj)
# Y = logit variable
# X = continuous variable
# Condition = values A and B, dummy coded; the design is repeated
# so all participants go through both Conditions
# subject = random effects for different subjects
Random effects:
Groups Name Variance Std.Dev. Corr
subject (Intercept) 0.85052 0.9222
X 0.08427 0.2903 -1.00
CondB 0.54367 0.7373 -0.37 0.37
X:CondB 0.14812 0.3849 0.26 -0.26 -0.56
Number of obs: 39401, groups: subject, 219
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.49686 0.06909 36.14 < 2e-16 ***
X -1.03854 0.03812 -27.24 < 2e-16 ***
CondB -0.19707 0.06382 -3.09 0.00202 **
X:CondB 0.22809 0.05356 4.26 2.06e-05 ***
이러한 완벽한 상관 관계의 원인은 데이터가 너무 복잡한 모델을 생성했기 때문입니다. 이러한 상황에서 제공되는 일반적인 조언은 (예를 들어 Matuschek et al., 2017; paper ) 과도하게 매개 변수화 된 계수를 0으로 고정하는 것입니다. 축소 된 모델에서 고정 효과의 현저한 변화가 관찰되면 그 효과를 수용해야합니다. 변경 사항이 없으면 원래 변경 사항을 승인하는 데 아무런 문제가 없습니다.
그러나 RE에 대한 고정 효과 (임의 효과)뿐만 아니라 RE 구조에도 관심이 있다고 가정 해 봅시다. 주어진 경우에, 이론적으로 Intercept
경사 X
가 0이 아닌 음의 상관 관계를 갖는다 고 가정하는 것이 좋습니다. 다음과 같은 몇 가지 질문이 있습니다.
그러한 상황에서 어떻게해야합니까? 완벽한 상관 관계를보고하고 데이터가 "실제"상관 관계를 추정하기에 "충분하지 않다"고 말해야합니까? 아니면 0 상관 모델을보고해야합니까? 아니면 "중요한"것이 더 이상 완벽하지 않기 위해 다른 상관 관계를 0으로 설정해야합니까? 나는 여기에 100 % 정답이 없다고 생각합니다. 주로 귀하의 의견을 듣고 싶습니다.
다른 매개 변수 간의 상관에 영향을 미치지 않고 2 개의 특정 임의 효과의 상관 관계를 0으로 수정하는 코드를 작성하는 방법은 무엇입니까?
blme
, MCMCglmm
, rstanarm
, brms
...)