내 글머 출력에서 ​​'고정 효과의 상관 관계'를 어떻게 해석합니까?


26

다음과 같은 출력이 있습니다.

Generalized linear mixed model fit by the Laplace approximation 
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape) 

 AIC   BIC    logLik deviance
 4062  4093  -2022   4044

Random effects:
Groups    Name        Variance Std.Dev.
landscape (Intercept) 0.82453  0.90804 
Number of obs: 239, groups: landscape, 45

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  2.65120    0.14051  18.868   <2e-16     
sMFS2        0.26922    0.17594   1.530   0.1260    
sAG2         0.09268    0.14529   0.638   0.5235    
sSHDI2       0.28345    0.17177   1.650   0.0989  
sbare        0.41388    0.02976  13.907   <2e-16 
seasonlate  -0.50165    0.02729 -18.384   <2e-16 
cropforage   0.79000    0.06724  11.748   <2e-16 
cropsoy      0.76507    0.04920  15.551   <2e-16 

Correlation of Fixed Effects:
           (Intr) sMFS2  sAG2   sSHDI2 sbare  sesnlt crpfrg
sMFS2      -0.016                                          
sAG2        0.006 -0.342                                   
sSHDI2     -0.025  0.588 -0.169                            
sbare      -0.113 -0.002  0.010  0.004                     
seasonlate -0.034  0.005 -0.004  0.001 -0.283              
cropforage -0.161 -0.005  0.012 -0.004  0.791 -0.231       
cropsoy    -0.175 -0.022  0.013  0.013  0.404 -0.164  0.557

모든 연속 변수 ( s변수 이름 앞의 작은 기호로 표시 )는 표준화되어 있습니다 (z- 점수). season는 2 단계 (초기 및 늦음) crop의 범주 형 변수이며 3 단계 (콘, 마초 및 콩)의 범주 형 변수입니다.

이 고정 효과 행렬의 상관 관계는 실제로 혼란 스럽습니다. 모든 상관 관계는 변수 쌍의 간단한 회귀를 볼 때와 반대의 부호를 갖기 때문입니다. 즉, 고정 효과 매트릭스의 상관 관계는이 변수들 사이에 매우 강한 음의 상관 관계가있을 때 cropforage와 사이에 강한 양의 상관 관계를 암시합니다. sbare사료 작물은 옥수수와 콩 작물에 비해 훨씬 적은 기초를 가지고있었습니다. 연속 변수 쌍에는 동일한 문제가 있으며 고정 효과 행렬의 상관 관계는 모든 것이 있어야하는 것과 반대라고 말합니다 ... 이것은 모델의 복잡성 때문일 수 있습니까 (간단한 회귀가 아님)? 변수가 표준화되었다는 사실과 관련이있을 수 있습니까?

감사.

답변:


27

"고정 효과의 상관 관계"출력에는 대부분의 결과가 나타내는 직관적 인 의미가 없습니다. 특히, 변수의 상관 관계에 관한 것이 아닙니다 (OP 메모와 같은). 사실 회귀 계수의 예상 상관 관계에 관한 것입니다. 이것이 다중 공선 성을 나타낼 수는 있지만 반드시 그런 것은 아닙니다. 이 경우 실험을 다시 수행 한 결과 계수 cropforage가 더 작아 지면의 계수 도 줄어들 것입니다 sbare.

lme4 Baayen을 다루는 그의 저서 "언어 데이터 분석 : R을 사용한 통계에 대한 실용적 소개"에서 출력의 일부를 억제하고 특별한 경우에만 유용하다고 선언합니다. 다음 은 Bates 자신이 출력의 해당 부분을 해석하는 방법을 설명하는 listserv 메시지입니다.

고정 효과의 추정량과의 대략적인 상관 관계입니다. (이것은 근사치가 매우 좋기 때문에 "대략"이라는 단어를 포함합니다.) 그보다 더 잘 설명하는 방법을 잘 모르겠습니다. 모델의 매개 변수에서 MCMC 샘플을 가져 왔다고 가정하면 고정 효과 매개 변수의 샘플에이 매트릭스와 같은 상관 관계 구조가 표시 될 것으로 예상합니다.


3
죄송합니다.이 질문은 아마도 어리석은 질문 일 것입니다. 그런데 왜 그 상관 관계를 고려해야합니까? 어떤 상황에서 출력을 고려해야합니까?
mtao

1
@ Teresa 그것은 당신이 그것을 사용하는 것에 달려 있습니다. 해석에 관심이 있다면, 혼란스러운 두 가지 영향의 원인이 무엇인지 알려줍니다. 예측에 관심이 있다면 다른 예측 모델이 어떻게 보일지에 대해 조금 알려주고 예측 변수를 삭제하면 모델이 어떻게 변경 될 수 있는지에 대한 힌트를 제공합니다.
russellpierce

1
예를 들어 0.90의 상관 관계를 가진 출력에 두 개의 변수가 있다고 상상해보십시오. 해석의 관점에서, 나는 그들 중 하나가 "혼란"하고 동일한 정보를 말하고있는 것처럼 보이기 때문에 그 중 하나를 삭제해야한다고 가정합니다. 예측에 관해서는, 내가 그중 하나를 떨어 뜨린다면, 다른 모델들은 서로 연관되어 있기 때문에 많이 변하지 않아야합니다. 아니면 이것을 잘못 해석하고 있습니까?
mtao

3
알다시피, 내가 말한 것을 반향하고 있다고 생각합니다. 그러나 반성시 100pct는 확실하지 않습니다. 새로운 질문을 열어서 가장 좋은 서비스를받을 수 있습니다. 그러면 질문에 더 많은 관심을 갖게되고 정답을받을 가능성이 높아집니다.
russellpierce

1
@russellpierce,이 답변에 감사드립니다. 그러나 한 가지 질문은 예측 변수 가 서로 연관 될 때 다중 공선 성이 발생한다는 것을 알았습니다 . 그러나 당신의 대답에서 당신은 다중 공선 성을 말할 수 있는 회귀 계수 (예측자가 아닌)의 상관 관계라고 말합니다 . 추정 계수 대신 예측 변수 자체를 상관시키지 않는 이유는 무엇입니까?
locus

0

음의 상관 관계와 양의 상관 관계가 값이 같고 부호 만 다른 경우 변수를 실수로 입력 한 것입니다. 그러나 나는 이미 통계에서 상당히 진보 된 것처럼 보이기 때문에 이것이 당신의 경우라고 생각하지 않습니다.

불일치가 발생하면 다중 공선 성이 원인 일 수 있습니다. 독립 변수가 겹치는 효과를 공유하거나 다른 의미로 서로 연관 되어 있을 때를 의미 합니다. 예를 들어, 변수 "성장률"및 "종양 크기"에 대한 모델링은 가능하고 더 큰 종양이 그 자체로 더 높은 성장률을 가질 가능성이 있기 때문에 다중 공선 성을 유발할 수있다. 이것은 모델을 혼란스럽게 할 수 있습니다. 모델에 서로 상관되는 독립 변수가 거의없는 경우 결과를 해석하는 것이 때때로 매우 어려워 질 수 있습니다. 때로는 상관 관계의 부호가 반전되는 정도까지도 완전히 이상한 계수로 이어집니다.

먼저 다중 공선 성의 원인을 탐지하고 처리 한 다음 분석을 다시 실행해야합니다.


1
-1; 오해의 소지가 있습니다. OP가 변수를 잘못 입력하지 않았으며 다중 공선 성이 문제가되지 않을 수 있습니다. 원시 고정 효과 사이의 상관 관계가이 시점에 해당 될 수 있지만 Simpson의 역설은 그러한 접근 방식으로 인해 잘못된 방향으로 이끌 수 있습니다.
russellpierce

1
왜 "오해의 소지가"? 어느 부분이 오해의 소지가 있었습니까? 나는 매우 명확하게 말했고 명확한 결론을 추론하지 않았습니다. 내가 말한 것은 실제로 다중 공선 성 표시 중 하나이며 VIF도 확인해야한다고 알려줍니다. 그러나 "OP가 변수를 잘못 입력하지 않았고 다중 공선 성이 문제가되지 않을 것"이라는 것을 어떻게 알거나 확신하지 못합니까?
Vic

1
게다가 당신은 내 게시물을 완전히 읽지 못했습니다 (그리고 그것을 downvoted하고 오도라고 부릅니다). 그렇다면 OP가 VIF (multiC의 공식 지표)를 확인하여 높은 상관 관계가 실제로 MC를 가리키는 지 확인해야한다고 제안 했습니까? 그러나 어쨌든, 오만과 개인적인 공격이없는 한 학습에 개방적입니다.
Vic

1
@ 빅 : 지금까지 당신의 의견을 보지 못했습니다. 나는 당신이 내 대응을 개인적인 공격으로 보려고하지 않았습니다. 나는 오해의 소지가 있었고 위의 정답이라고 믿는 것을 제공했습니다. 나는 당신의 게시물 전체를 읽었습니다. 나는 의견을 파는지 여부를 모른다. 나는 나의 downvote를지지한다.
russellpierce

1
...하지만 나는 그 판단에 착각 할 수 있습니다. 그러나 내가 왜 공감하지 않고 공감했는지 설명하는 것이 더 좋았습니다.
russellpierce

0

모델의 "vcov"를 상관 행렬로 변환하여 고정 효과 간의 이러한 상관 관계를 얻는다는 것을 보여주는 것이 도움이 될 수 있습니다. 만약이 fit다음, 당신의 장착 lme4 모델입니다

vc <- vcov(fit)

# diagonal matrix of standard deviations associated with vcov
S <- sqrt(diag(diag(vc), nrow(vc), nrow(vc)))

# convert vc to a correlation matrix
solve(S) %*% vc %*% solve(S)

고정 효과 사이의 상관 관계는 비 대각선 항목입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.