glmer의 랜덤 효과 분산 해석


13

데이터가 이항 분포 (과일 성숙 또는 성숙하지 않음) 인 수분에 관한 논문을 개정하고 있습니다. 그래서 나는 glmer하나의 무작위 효과 (개별 식물)와 하나의 고정 효과 (치료)를 사용했습니다. 리뷰어는 식물이 과일 세트에 영향을 미쳤는지 알고 싶어하지만 glmer결과를 해석하는 데 문제가 있습니다.

나는 웹을 읽었으며 직접 비교 glm하고 glmer모델에 문제가있을 수 있으므로 그렇게하지 않습니다. 질문에 대답하는 가장 간단한 방법은 랜덤 효과 분산 (1.449, 아래)을 총 분산 또는 처리에 의해 설명 된 분산과 비교하는 것입니다. 그러나 다른 분산을 어떻게 계산합니까? 아래 출력에 포함되지 않은 것 같습니다. 이항에 포함되지 않은 잔차 분산에 대한 내용을 읽었습니다 glmer. 랜덤 효과의 상대적 중요성을 어떻게 해석합니까?

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509

답변:


12

GLMM 에서 "각 효과에 의해 설명 된 비례 분산"에 대한 유사체를 얻는 것이 원칙적으로 가능하지만, 몇 가지 복잡한 요소가 있습니다 (모델의 레벨은 "총 분산"으로 간주되며, 이로 인해 샘플링 변동을 어떻게 정량화합니까? 최저 수준 [이 경우 이항] 샘플링 분포)? Nakagawa와 Schielzeth (doi : 10.1111 / j.2041-210x.2012.00261.x)는 생태학에서 꽤 인기를 얻은 (G) LMM에 대한 R ^ 2 (전체 분산 비율)를 계산하는 일반적인 접근법을 제시합니다. 쉬 등 2003비슷한 접근법을 취하십시오. 원칙적으로이 접근법은 다른 용어로 설명 된 분산의 비율을 고려하도록 확장 될 수 있습니다 [그러나 이런 방식으로 고려 된 모델의 모든 용어의 '분산의 비례'는 아마도 최대 100 %가 되지 않을 것입니다. 더 많든 적든].

4σ1.96σ+1.96σ

시각적으로 :

여기에 이미지 설명을 입력하십시오


아르 자형2

1
나는 그것이 미친 것이거나 반드시 잘못된 질문이라고 생각하지 않는다고 말하고있었습니다. 그러나 계층 구조와 GLM 유사 모델은 모두 웜 캔을 열어 답을 찾기가 더 어려워집니다. 나는 일반적으로 귀찮게하지 않지만 사람들이 왜 적합도 또는 모델에서 용어의 상대적 중요성을 합리적으로 측정 한 숫자를 찾으려고하는지 알 수 있습니다.
Ben Bolker

합리적입니다. Btw, 10 식물, 3 처리 및 N = 30, OP가 고정 효과로 둘 다 사용하는 모델에 적합하다는 내 제안에 대해 어떻게 생각하십니까? 필자는 이것이 반드시 올바른 최종 모델이라고 생각하지는 않지만 식물간에 차이가 있는지 테스트하고 비교를 위해 비슷한 기초에 두 변수를 넣는 잠재적으로 허용되는 방법으로 저를 공격합니다.
gung-모니 티 복원

나에게 합리적인 것 같습니다.
벤 Bolker

gung이 제안한대로 고정 효과로 처리와 식물을 모두 가진 모델을 적합 시켰으며, 식물 항은 p- 값이 매우 높았습니다 (p = 0.3). "식물 간 표준 편차가 1.20으로 가장 큰 처리 효과 (-1.18)의 크기에 매우 가깝습니다"라는 점을 고려할 때 이것이 이상하게 보입니까? 2 개의 고정 효과가있는 분산 분석에서 왜 중요하지 않은 것으로 표시됩니까?
jwb4

3

원하는 것은 분산이 다음과 같은지 테스트하는 것 PlantID입니다.0. 그러나 null 값이 허용되는 공간의 경계에 있기 때문에 실행하기가 이상한 테스트입니다. 이러한 테스트는 여전히 진행되고 있지만 많은 사람들이 테스트에 매우 불편합니다.

귀하의 경우 플랜트 당 여러 측정 값이 있으므로 하나의 빠르고 더러운 접근 방식은 PlantID고정 효과로 모델을 실행하고 해당 효과를 테스트하는 것입니다.


1

검토 자에 대한 간단한 대답은 "예"입니다. 랜덤 효과의 분산이 0과 크게 다른지 여부를 테스트하도록 요청하는 경우 몇 가지 옵션이 있습니다. 임의의 효과의 분산이 0과 다른 경우 많은 똑똑한 사람들이 테스트에 불편하다는 점에 유의하십시오.

가장 권장하지는 않지만 가능성 비율 검정이 가장 간단합니다. 경계에서 테스트 할 때 매우 보수적입니다 (예 : 분산이 0 인 분산에 대해 테스트하는 경우). p 값이 실제 값의 약 2 배라는 사실에 대한 경험이 있습니다.

대부분의 장소에서 권장되는 방법은 파라 메트릭 부트 스트랩입니다. 패키지 bootMer에서 사용할 수 있습니다 lme4. lmer 함수의 REML 파라미터를 FALSE로 설정했는지 확인하십시오. 어쨌든).

몇 가지 팁과 추가 자료 :

http://glmm.wikidot.com/faq (임의의 효과가 중요한지 어떻게 테스트 할 수 있습니까?

고정 효과에 대한 lmer () 파라 메트릭 부트 스트랩 테스트

http://www.r-bloggers.com/using-bootmer-to-do-model-comparison-in-r/


모델 비교에 대한이 명쾌하고 신속한 안내에 감사드립니다. 그러나 랜덤 변수 효과의 "크기"를 어떻게 해석 할 수 있습니까? 즉, 임의의 변수로 설명 된 분산을 고정 변수 (처리)로 설명 된 분산과 어떻게 비교합니까? 부트 스트랩 된 LRT 테스트 결과에서 이것이 어떻게 수집되는지 알 수없는 것 같습니다.
jwb4

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.