lmer의 분산 공분산 행렬


18

혼합 모델의 장점 중 하나는 데이터에 대해 분산 공분산 행렬을 지정할 수 있다는 것입니다 (복합 대칭, 자기 회귀, 비 구조적 등). 그러나 lmerR의 함수는이 행렬을 쉽게 지정할 수 없습니다. 누구든지 lmer기본적으로 어떤 구조를 사용하고 왜 쉽게 지정할 수 없는지 알고 있습니까?

답변:


9

혼합 모형은 분산 성분 모형 (일반화 된 버전)입니다. 고정 효과 부분을 작성하고, 일부 관측 그룹에 공통적 인 오류 항을 추가하고, 필요한 경우 링크 기능을 추가 한 후이를 가능성 최대화에 넣습니다.

그러나 설명하는 다양한 분산 구조는 추론의 견고성을 위해 혼합 / 다단계 모델의 유연성 중 일부를 상쇄하는 일반화 된 추정 방정식에 대한 작업 상관 관계 모델입니다. GEE를 사용하면 고정 부분에 대한 추론에만 관심이 있으며 혼합 모형에서와 같이 분산 성분을 추정하지 않아도됩니다. 이러한 고정 효과의 경우 상관 관계 구조가 잘못 지정된 경우에도 적절한 견고 / 샌드위치 추정치를 얻을 수 있습니다. 그러나 모델이 잘못 지정되면 혼합 모델에 대한 추론이 중단됩니다.

따라서 많은 공통점 (다중 레벨 구조 및 잔차 상관을 처리하는 기능)이 있지만 혼합 모델과 GEE는 여전히 다소 다른 절차입니다. GEE를 다루는 R 패키지는 적절하게 호출 gee되며 가능한 corstr옵션 값 목록에서 언급 한 구조를 찾을 수 있습니다.

GEE의 관점에서 볼 lmer때, 적어도 모델에 두 가지 수준의 계층 구조가 있고 임의의 절편 만 지정된 경우 교환 가능한 상관 관계로 작동합니다.


감사합니다 나는 전에 GEE에 대해 들어 본 적이 없으며 혼합 모델링을 배우려고 노력했습니다 (이는 까다 롭고 소프트웨어 구현의 차이점에 의해 증폭됩니다). 나는 GEE에게 시험을 줄 것이다. 나는 생의학에 의존하는 측정을 반복 측정하는 간단한 실험을하고 있습니다. 나는 주로 고정 부분에 관심이 있습니다. 저의 이전 교육은 대부분 표준 고정 효과 분산 분석에 있으므로 쉽게 전환 할 수 있습니다.
Nikita Kuznetsov

나는 고정 매개 변수를 추정하는 아이디어를 좋아하고 gee 라이브러리를 사용해 보았습니다. 다른 라이브러리도 있습니다 (예 : geepack). 그들은 어떤 이유로 더 나빠 집니까? 내 분야에서 사람들은 p- 값을보고해야합니다. 추정값에서이를 구하고 군집을 고려하여 쌍별 비교를 수행 할 수있는 방법이 있습니까?
Nikita Kuznetsov

무엇에 대한 쌍 비교? 다양한 R 라이브러리가 항상 나를 혼란스럽게 만들었으며 특정 모델에서 실제로 작업해야 할 필요가 없다면 패키지 간의 차이점에 대해 연구하지 않습니다.
StasK

StatsK, 이것이 정말로 맞습니까? 저는 다단계 모델링의 초보자이지만 Hox (2010) 또는 Rabe-Hesketh & Skrondal (2013)은 MLE과 GEE를 통해 다른 분산 추정값을 명확하게 구분합니다. 예를 들어 "강력한"샌드위치 표준 오류를 계산할 때 Hox (p. 260)에서는 정보 행렬 / 헤센 행렬의 역수를 사용하여 (다단계 구조를 고려하여) 다단계 모델링을 통해 또는 원료 잔류 및 계수 (GEE 방식) 계산 후 GLS를 사용하여
아르네 조나스 WARNKE을

1
StasK가 제안한 차이점이 실제로 올바른지 확실하지 않습니다. 이러한 대체 상관 구조는 실제로 GEE에 의해 사용되지만 R, SAS Proc Mixed 또는 Stata의 혼합 명령이이를 수행합니다.
Jonathan Bartlett


3

내 지식으로는 lmer는 이것을 쉽게 해결할 수있는 방법이 없다. 또한 대부분의 경우 lmer가 Cholesky 인수 분해에 희소 행렬을 많이 사용한다는 점을 감안할 때 완전히 구조화되지 않은 VCV를 허용하지 않을 것입니다.

"기본 구조"에 대한 귀하의 질문에 답하기 위해 : 기본 개념은 없습니다. 구조를 정의하는 방법에 따라 해당 구조를 사용합니다. 예 : 와 같은 임의의 효과를 사용하면 각 임의의 효과에 3 개의 레벨이 있습니다.(1|아르 자형이자형에프에프1)+(1|아르 자형이자형에프에프2)

아르 자형=[σ아르 자형이자형12000000σ아르 자형이자형12000000σ아르 자형이자형12000000σ아르 자형이자형22000000σ아르 자형이자형22000000σ아르 자형이자형22]

LME를 사용하면 모든 것이 손실되지는 않습니다. 이러한 VCV 매트릭스 속성을 "쉽게"지정할 수 있습니다. R- 패키지 MCMCglmm을 사용하고 있습니다. 상기 봐 CourseNotes.pdf , P.70을. 이 페이지에서는 lme4 랜덤 효과 구조가 어떻게 정의되는지에 대한 몇 가지 유사점을 제공하지만 직접 보 겠지만 lmer는 MCMCglmm보다 유연성이 떨어집니다.

도중에 문제 nlme의 lme corStruct 클래스가 있습니다. corCompSymm , corAR1 등 등 이 트레드에서 Fabian의 응답 은 lme4 기반 VCV 사양에 대한 좀 더 간결한 예를 제공하지만 MCMCglmm 또는 nlme에서와 같이 명확하지는 않습니다.


나는 이전 배포판의 순진한 선택 때문에 MCMCglmm을 "신뢰하지"않습니다.
Stéphane Laurent

A. 나는 그것이 "순진"하다고 생각하지 않습니다. 그들은 유효한 가정을 반영 할 수 있습니다. 무언가에 대해 강하게 느끼면 부적절한 사전을 정의 할 수도 있습니다. B. 그것은 내 대답의 일부일 뿐이며 그것이 유일한 길이라고 말하지 않았습니다. lme4에 대한 예를 들었습니다. C. 당신이 그것을 실질적으로 sabreR과 함께 사용할 수있는 유일한 패키지 변수 혼합 효과를 할 필요가 있다면 ...
usεr11852는 분석 재개 MONIC 말한다

죄송합니다. 귀하의 답변에 대한 비평은 아닙니다. "순진한 우선 순위"라고 말할 때 나는 비 정보적인 우선 순위에 대해 이야기했습니다.
Stéphane Laurent

이 R 행렬이 옳은 것 같지는 않습니다. "고전적인"반복 측정 ANOVA조차도 조건들 사이에 0이 아닌 상관 관계를 허용합니다 (저는 화합물 대칭 매트릭스를 생각하고 있습니다). 이 행렬은 두 군집에 무작위로 할당 된 개체 간 설계에만 유효 할 것 같습니다.
니키타 쿠즈 네 초프

(1|아르 자형이자형에프에프1)+(1|아르 자형이자형에프에프2)
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.