동일한 자유 도로 혼합 효과 모델 비교


15

여기서 추상화하려고하는 실험이 있습니다. 내가 당신 앞에 하얀 돌 3 개를 던지고 그들의 위치에 대한 판단을 요구한다고 상상해보십시오. 나는 돌의 다양한 속성과 당신의 응답을 기록합니다. 나는 여러 과목에 걸쳐 이것을한다. 두 가지 모델을 생성합니다. 하나는 가장 가까운 돌이 응답을 예측하고 다른 하나는 돌의 기하학적 중심이 응답을 예측한다는 것입니다. 따라서 RI에서 lmer를 사용하면 쓸 수 있습니다.

mNear   <- lmer(resp ~ nearest + (1|subject), REML = FALSE)
mCenter <- lmer(resp ~ center  + (1|subject), REML = FALSE)

업데이트 및 변경-몇 가지 유용한 주석이 포함 된보다 직접적인 버전

나는 시도 할 수 있었다

anova(mNear, mCenter)

물론 그들은 중첩되어 있지 않으므로 실제로 그렇게 비교할 수 없기 때문에 올바르지 않습니다. anova.mer가 오류를 던질 것으로 예상했지만 그렇지 않았습니다. 그러나 내가 여기서 시도 할 수있는 가능한 중첩은 자연스럽지 않고 여전히 분석력이 다소 떨어집니다. 모델이 자연스럽게 중첩 된 경우 (예 : 2 차 선형) 테스트는 한 가지 방법 일뿐입니다. 그러나이 경우 비대칭 결과가 있다는 것은 무엇을 의미합니까?

예를 들어, 모델을 세 가지로 만들 수 있습니다.

mBoth <- lmer(resp ~ center + nearest + (1|subject), REML = FALSE)

그런 다음 anova를 할 수 있습니다.

anova(mCenter, mBoth)
anova(mNearest, mBoth)

이것은 공정한 것이며 이제는 중심이 가장 가까운 효과 (두 번째 명령)에 추가되지만 가장 가까운 것이 중심에 추가 될 때 실제로 BIC가 올라갑니다 (낮은 parsimony에 대한 수정). 이것은 의심되는 것을 확인합니다.

그러나 이것으로 충분합니까? 중심과 가장 가까운 거리가 서로 밀접한 관련이있을 때이 공정은 공평합니까?

설명 변수를 더하거나 빼지 않을 때 (자유도) 모델을 분석적으로 비교하는 더 좋은 방법이 있습니까?


모델이 중첩되어 있지 않습니다. 둘 사이에 LRT를 사용하는 이유는 무엇입니까?
chl

귀하의 의견
John

답변:


9

그래도 고정 효과에 대한 신뢰 구간을 계산하고 AIC 또는 BIC를보고 할 수 있습니다 (예 : Cnann et al. , Stat Med 1997 16 : 2349 참조).

이제 Wagenmakers 등 의 파라 메트릭 부트 스트랩을 사용하여 모델 모방 평가를 살펴볼 수 있습니다 . 두 경쟁 모델의 품질 평가에 대한 초기 질문과 더 유사합니다.

그렇지 않으면 LMM에서 설명되는 분산 측정에 대한 두 가지 논문은 다음과 같습니다.

  • Lloyd J. Edwards, Keith E. Muller, Russell D. Wolfinger, Bahjat F. Qaqish 및 Oliver Schabenberger (2008). 선형 혼합 모형의 고정 효과에 대한 R2 통계 , Statistics in Medicine , 27 (29), 6137–6157.
  • Ronghui Xu (2003). 선형 혼합 효과 모델의 변동, 의학 통계 , 22 (22), 3527–3541 측정 설명 .

그러나 더 나은 옵션이있을 수 있습니다.


11

ronaf의 제안에 따르면 Vuong은 중첩되지 않은 모델에 대한 우도 비율 테스트에 대한 최신 논문을 작성합니다. KL 거리를 최소화한다는 점에서 AIC와 유사한 KLIC (Kullback-Leibler Information Criterion)을 기반으로합니다. 그러나 가설에 대한 확률 적 명세를 설정하므로 LRT를 사용하면보다 원칙적인 비교가 가능합니다. 보다 접근성이 좋은 콕스 및 부옹 테스트 버전은 Clarke et al. 특히 Vuong LRT 테스트 계산 알고리즘을 보여주는 그림 3을 참조하십시오.

다른 모델에서는 Vuong 테스트의 R 구현이 있지만 lmer는 아닙니다. 그러나 위에서 언급 한 개요는이를 구현하기에 충분해야합니다. 계산에 필요한대로 lmer에서 각 데이터 포인트에서 평가 된 가능성을 얻을 수 있다고 생각하지 않습니다. sig-ME에 대한 메모에서 Douglas Bates에는 도움이 될만한 몇 가지 지침 이 있습니다 (특히 그가 언급 한 비 네트 ).


더 오래된

또 다른 옵션은 예측 정확도 테스트에서 모형의 적합치를 고려하는 것입니다. Williams-Kloot 통계가 여기에 적합 할 수 있습니다. 기본 접근법은 두 모델의 적합치의 선형 조합에 대해 실제 값을 회귀하고 기울기를 테스트하는 것입니다.

첫 번째 논문은 테스트 (및 기타)에 대해 설명하고 두 번째 논문은 계량 패널 모델에 적용됩니다.


lmerAIC를 사용 하고 비교할 때 기능의 기본값은 REML 방법 (제한된 최대 가능성)을 사용하는 것입니다. 이는 편향이 적은 추정값을 얻는 데는 좋지만 모형을 비교할 때는 REML=FALSE최대 우도 방법을 사용하여 피팅하는 데 적합해야합니다 . 핀 헤이 / 베이츠의 책은 그것의 OK가 AIC / REML 또는 ML 중 하나와 가능성을 비교하는 아래에 몇 가지 조건을 언급,이 아주 잘 귀하의 경우에 적용 할 수 있습니다. 그러나 일반적인 권장 사항은 단순히 다시 맞추는 것입니다. 예를 들어, Douglas Bates의 게시물을 참조하십시오.


REML = FALSE에 적합하다고 지정하지 않았습니다. 그래도 나는 아직 약간 건조하다 ... AIC는 나에게 랜덤 효과를 포함한 모든 가능성을 측정한다. 그것은 큰 구성 요소입니다. 물론 AIC는 정확히 동일하지는 않습니다. 따라서 얼마나 큰지를 알려주는 분석 방법없이 더 큰 값을 선택하는 것은 현명하지 않은 것처럼 보입니다.
John

@John이 강의에서는 REML vs. ML 및 AIC에 대한 흥미로운 점 (및 John이 말한 내용, j.mp/bhUVNt )을 강조 합니다. GLMM의 Bolker의 검토에서 살펴 봐야 가치가있다 : j.mp/cAepqA .
chl

4

drcox 의 논문이 있으며 별도의 [unested] 모델 테스트에 대해 설명합니다. 혼합 모델의 복잡성을 일으키지 않는 몇 가지 예를 고려합니다. [R 코드가있는 시설은 제한되어 있으므로 모델이 무엇인지 잘 모르겠습니다.]

altho cox의 논문은 문제를 직접 해결하지 못할 수도 있지만 두 가지 방법으로 도움이 될 수 있습니다.

  1. 당신은 그의 논문에 대한 인용을 위해 구글 학자를 검색하고, 그와 같은 결과가 당신이 원하는 것에 더 가까운 지 알 수 있습니다.

  2. 분석적으로 구부러진 경우 문제에 콕스 방법을 적용 해 볼 수 있습니다. [아마도 마음이 아프지 않다.]

btw-cox는 두 모델을 더 큰 모델로 결합한 srikant 브로치 아이디어를 전달할 때 언급합니다. 그는 어떤 모델이 더 나은지를 결정하는 방법을 추구하지는 않지만, 두 모델 중 어느 것도 우수하지 않더라도 결합 된 모델이 데이터에 적절하게 적합 할 수 있다고 언급합니다. [귀하의 상황에서 결합 된 모델이 의미가 있는지는 확실하지 않습니다.]


3

코드를 파싱 할만 큼 R을 잘 모르지만 여기에 한 가지 아이디어가 있습니다.

공변량으로 중심과 근거리가 모두있는 모형을 추정합니다 (이 mBoth 호출). mCenter와 mNear는 mBoth에 중첩되어 있으며 mBoth를 벤치 마크로 사용하여 mCenter와 mNear의 상대적 성능을 비교할 수 있습니다.


1
두 사람이 실제로 서로 관련되어 있기 때문에 이것이 적절하지 않다고 생각했습니다. 중심이 멀어 질수록 근거리가 가까운 경향이 있습니다.
John

@ 존 좋은 지적.

나는 당신의 요점도 좋다고 생각합니다 ... 실제로 그것이 중요하지는 않습니다. 나는 그것이 높지만 0.8 미만이지만 여전히 분석 가능하다는 것을 알고 있습니다.
John
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.