lme4 (> 1.0)가 장착 된 이항 GLMM의 적합성을 평가하는 방법은 무엇입니까?


19

나는 이항 분포와 로짓 링크 함수를 가진 GLMM을 가지고 있으며 데이터의 중요한 측면이 모델에 잘 표현되지 않았다고 생각합니다.

이것을 테스트하기 위해 데이터가 로짓 스케일의 선형 함수에 의해 잘 설명되어 있는지 여부를 알고 싶습니다. 따라서 잔차가 제대로 작동하는지 알고 싶습니다. 그러나 어떤 잔차 플롯을 플롯하고 플롯을 해석하는 방법을 알 수 없습니다.

새 버전의 lme4 ( GitHub의 개발 버전)를 사용하고 있습니다 .

packageVersion("lme4")
## [1] ‘1.1.0’

내 질문은 : 로짓 링크 함수로 이항 일반 선형 혼합 모형의 잔차를 어떻게 검사하고 해석합니까?

다음 데이터는 실제 데이터의 17 %에 불과하지만 피팅은 이미 내 컴퓨터에서 약 30 초가 소요되므로 다음과 같이 남겨 두십시오.

require(lme4)
options(contrasts=c('contr.sum', 'contr.poly'))

dat <- read.table("http://pastebin.com/raw.php?i=vRy66Bif")
dat$V1 <- factor(dat$V1)

m1 <- glmer(true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1), dat, family = binomial)

가장 간단한 줄거리 ( ?plot.merMod)는 다음을 생성합니다.

plot(m1)

여기에 이미지 설명을 입력하십시오

이것은 이미 나에게 무언가를 말하고 있습니까?


1
나는 돌아와서 이것에 균열이 생길 수도 있지만, 일반적인 대답은 이진 모델의 잔차를 다루기가 어렵다는 것입니다. 내 주요 발견은 지금까지 위가 플롯에 약간에로 확대하고, 부드럽게 라인을 추가하는 (사용 type=c("p","smooth")에서 plot.merMod, 또는 이동 ggplot당신이 신뢰 구간을 원하는 경우) 작지만 의미있는 패턴있을 것처럼 보이는 것을 인을 다른 링크 기능을 채택하여 해결할 수 있습니다. 그게 다야 ...
벤 볼커

@BenBolker 감사합니다. 그리고 당신은 질문에 대한 응답으로 이것과 괴물 학에 대한 링크를 게시 할 수 있습니까? 그런 다음 적어도 150 포인트를 얻습니다.
Henrik

3
이 CV 스레드 stats.stackexchange.com/questions/63566/… 이 매우 유용 하다는 것을 알았습니다 . 이 게시물은 R에서 비닝 잔차 그림을 만드는 방법을 설명합니다.
Nova

@Henrik 모델이 어떻게 작동하는지 설명해 주시겠습니까 true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1)? 윌 모델주고의 사이의 상호 작용의 추정 distance*consequent, distance*direction, distance*dist과의 기울기 directiondist 와 그 다름 V1? 사각형은 무엇을 (consequent+direction+dist)^2나타 냅니까?
ABC

@ 헨릭 나는 당신의 코드를 실행하고 그것을 보여줍니다 Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 0.123941 (tol = 0.001, component 1). 왜 ?
ABC

답변:


18

더 나은 시간이 없기 때문에 짧은 대답 : 이것은 도전적인 문제입니다. 이진 데이터는 거의 항상 적합도를 평가하기 위해 일종의 비닝 또는 스무딩이 필요합니다. 사용하기 다소 도움이되었다 fortify.lmerMod(에서 lme4와 함께 실험) ggplot2특히 geom_smooth()(기본적으로 위의이 같은 잔류 - 대 - 장착 플롯을 그릴 수 있지만, 신뢰 구간에 (나는 또한 y는 확대하려면 약간의 제한 축소 -5,5) 지역). 이는 링크 기능을 조정하여 개선 할 수있는 체계적인 변형을 제안했습니다. (또한 다른 예측 변수에 대한 잔차를 플로팅하려고 시도했지만 너무 유용하지 않았습니다.)

모든 3 방향 상호 작용으로 모델을 피팅하려고 시도했지만 이탈 또는 매끄러운 잔차 곡선의 모양이 크게 향상되지는 않았습니다.

그럼 형태의 역방향 링크 기능을 시도 무작위 힘이 비트를 사용 위한 0.5 내지 2.0의 범위 : λ(물류(엑스))λλ

## uses (fragile) internal C calls for speed; could use plogis(),
##  qlogis() for readability and stability instead
logitpower <- function(lambda) {
    L <- list(linkfun=function(mu)
              .Call(stats:::C_logit_link,mu^(1/lambda),PACKAGE="stats"),
              linkinv=function(eta)
              .Call(stats:::C_logit_linkinv,eta,PACKAGE="stats")^lambda,
              mu.eta=function(eta) {
                  mu <-  .Call(stats:::C_logit_linkinv,eta,PACKAGE="stats")
                  mu.eta <-  .Call(stats:::C_logit_mu_eta,eta,PACKAGE="stats")
                  lambda*mu^(lambda-1)*mu.eta
              },
              valideta = function(eta) TRUE ,
              name=paste0("logit-power(",lambda,")"))
    class(L) <- "link-glm"
    L
}

나는 0.75가 원래 모델보다 약간 낫다는 것을 알았습니다.λ

참조 : http://freakonometrics.hypotheses.org/8210


3

이것은 생물 통계학 / 역학 과정에서 매우 일반적인 주제이며 기본적으로 모델의 특성으로 인해 좋은 해결책은 없습니다. 종종 해결책은 잔차를 사용하여 자세한 진단을 피하는 것이 었습니다.

Ben은 이미 진단에는 종종 비닝 또는 스무딩이 필요하다고 썼습니다. 잔류 물 비닝은 R 패키지 암에서 사용할 수 있습니다 (예 : 이 스레드 참조) . 또한 예측 된 확률을 사용하는 일부 작업이 있습니다. 한 가지 가능성은 이 스레드 에서 앞서 논의한 분리 도표입니다 . 그것들은 귀하의 경우에 직접 도움이 될 수도 있고 아닐 수도 있지만 해석에 도움이 될 수 있습니다.


-1

잔차 그림 대신 AIC를 사용하여 모형의 적합을 확인할 수 있습니다. R : AIC (model1)의 명령은 숫자를 줄 것입니다 ... 따라서 다른 모델 (예 : 더 많은 예측 변수 포함)-AIC (model2)와 비교해야합니다. 두 출력을 비교하면 AIC 값이 낮은 모델이 필요합니다.

그건 그렇고, 글 라이머 모델의 요약을 얻을 때 AIC 및 로그 우도 비율과 같은 것들이 이미 나열되어 있으며 둘 다 모델 적합에 대한 유용한 정보를 제공합니다. 귀무 가설을 기각하기 위해 로그 우도 비율에 큰 음수를 원합니다.


3
이것은 OP가 경쟁 모델을 비교하려고 할 때 더 유용하지만 그것이 그렇게하려는 것처럼 보이지 않으며 AIC를 사용하여 절대 모델 적합을 평가할 수 없습니다.
Patrick Coulombe

-3

적합치 대 잔차 그림은 (투명한) 패턴을 나타내지 않아야합니다. 플롯은 모델이 데이터와 잘 작동하지 않음을 보여줍니다. http://www.r-bloggers.com/model-validation-interpreting-residual-plots/를 참조 하십시오


1
당신이 틀렸다고 생각합니다. 링크 기능에 의해 특정 패턴이 예측됩니다 : stats.stackexchange.com/q/25068/442
Henrik

1
아마도 유용하다 : freakonometrics.hypotheses.org/8210
Ben Bolker
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.