Anova ()와 drop1 ()이 GLMM에 다른 답변을 제공 한 이유는 무엇입니까?


10

GLMM 형식이 있습니다.

lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + 
                (1 | factor3), family=binomial)

를 사용할 때 자동차 패키지 또는에서 사용할 때 drop1(model, test="Chi")와 다른 결과를 얻습니다 . 후자의 두 사람도 같은 대답을합니다.Anova(model, type="III")summary(model)

조작 된 데이터를 사용 하여이 두 가지 방법이 일반적으로 다르지 않다는 것을 알았습니다. 균형 선형 모델, 불균형 선형 모델 (다른 그룹에서 동일하지 않은 n) 및 균형 일반화 된 선형 모델에 대해 동일한 대답을 제공하지만 균형 잡힌 일반 선형 혼합 모델에는 해당되지 않습니다. 따라서 임의의 요인이 포함 된 경우에만이 불일치가 나타납니다.

  • 이 두 방법 사이에 왜 불일치가 있습니까?
  • GLMM을 사용하는 경우해야 Anova()또는 drop1()사용?
  • 이 두 가지의 차이점은 적어도 내 데이터에는 다소 미미합니다. 어느 것이 사용 되더라도 중요합니까?

답변:


7

테스트가 계산되는 것의 차이점이라고 생각합니다. car::AnovaWald 테스트를 사용하지만 drop1단일 항을 제거하는 모형을 다시 맞 춥니 다. 존 폭스 (John Fox)는 우도 (Wald) 테스트와 우도 비 테스트 (즉,의 전략 drop1)를 사용하여 개조 된 모델의 테스트 는 선형이지만 반드시 비선형 모델은 아니라고 나에게 썼다 . 불행히도이 메일은 offlist였으며 어떠한 참조도 포함하지 않았습니다. 그러나 그의 책에는 Wald 테스트에 관한 장이 있으며, 여기에는 원하는 정보가 포함될 수 있습니다.

car::Anova말하는 도움 :

유형 II 테스트는 한계의 원리에 따라 계산되며, 용어의 고차 친척을 무시하는 것을 제외하고는 모든 용어를 테스트합니다. 소위 유형 III 테스트는 한계를 위반하여 모델의 각 항을 다른 모든 항을 테스트합니다. Type-II 검정의 이러한 정의는 모든 예측 변수가 요인이지만보다 일반적이지는 않은 (즉, 정량 예측 변수가있는 경우) 분산 분석 모델을 위해 SAS에서 생성 한 테스트에 해당합니다. 유형 III 테스트를위한 모델을 공식화 할 때는주의해야합니다. 그렇지 않으면 테스트 된 가설이 의미가 없습니다.

불행히도 나는 또한 그것을 알고 싶습니다 당신에게 두 번째 또는 세 번째 질문에 대답 할 수 없습니다.


재 응답 의견 업데이트 :

일반화 된 혼합 모델에 대한 Wald, LR 및 F 테스트는 없습니다. 혼합 모델 (예 : 에서 반환 한 객체) Anova만 허용 "chisq"하고 "F"테스트합니다 . 사용법 섹션은 다음과 같이 말합니다."mer"lmer

## S3 method for class 'mer'
Anova(mod, type=c("II","III", 2, 3), 
    test.statistic=c("chisq", "F"), vcov.=vcov(mod), singular.ok, ...)

그러나 mer객체에 대한 F- 검정 은에 의해 계산 pbkrtest되므로 내 지식은 선형 혼합 모델에서만 작동 하므로 AnovaGLMM은 항상 반환해야 chisq하므로 차이가 없습니다.

질문에 관한 업데이트 :

내 이전의 대답은 당신의 주요 질문의 차이에 대응하기 위해 노력 Anova()하고 drop1(). 그러나 이제는 특정 고정 효과가 중요한지 테스트하고 싶다는 것을 이해합니다. R-SIG 혼합 모델링 자주 묻는 질문 은이에 대한 다음 말한다 :

단일 매개 변수 테스트

최악에서 최고로 :

  • Wald Z- 테스트
  • df를 계산할 수있는 균형 잡힌 중첩 LMM : Wald t-tests
  • 모수를 분리 / 삭제할 수 있도록 모델을 설정하거나 (anova 또는 drop1을 통해) 또는 우도 프로파일 계산을 통해 우도 비율 테스트
  • MCMC 또는 파라 메트릭 부트 스트랩 신뢰 구간

효과 테스트 (즉, 여러 매개 변수가 동시에 0인지 테스트)

최악에서 최고로 :

  • Wald 카이 제곱 검정 (예 : 자동차 :: Anova)
  • 가능성 비율 검정 (Aanova 또는 Drop1을 통해)
  • df를 계산할 수있는 균형 잡힌 중첩 LMM : 조건부 F- 검정
  • LMM의 경우 : df 보정이 포함 된 조건부 F- 검정 (예 : pbkrtest 패키지의 Kenward-Roger)
  • MCMC 또는 매개 변수 또는 비모수 부트 스트랩 비교 (비모수 부트 스트랩은 그룹화 요소를 고려하여 신중하게 구현해야 함)

(강조 추가)

이는 car::Anova()GLMM 사용 방식 이 일반적으로 권장되지 않지만 MCMC 또는 부트 스트랩을 사용하는 방식을 사용해야한다는 것을 나타냅니다. 나도 몰라 pvals.fnc로부터 languageR그 가치가 시도입니다 GLMMs와 패키지 웍하지만.


1
고마워, 헨릭 Anova ()는 Wald, LR 및 F의 세 가지 테스트를 계산할 수 있습니다. 세 가지를 모두 시도했지만 차이가 없습니다. 데이터에 적합하지 않다고 판단되는 테스트를 사용하지 않는 함수라는 느낌이 들었습니다.
tim.farkas
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.