실제로 혼합 효과 모델에서 랜덤 효과 공분산 행렬은 어떻게 계산됩니까?


19

기본적으로 궁금한 점은 서로 다른 공분산 구조가 적용되는 방식과 이러한 행렬 내부의 값이 계산되는 방식입니다. lme ()과 같은 함수를 사용하면 원하는 구조를 선택할 수 있지만 어떻게 계산되는지 알고 싶습니다.

선형 혼합 효과 모델 .Y=Xβ+Zu+ϵ

여기서 및 입니다. 더욱이:udN(0,D)ϵdN(0,R)

Var(Y|X,Z,β,u)=R

Var(Y|X,β)=ZDZ+R=V

간단히하기 위해 R = \ sigma ^ 2I_n 이라고 가정 R=σ2In합니다.

기본적으로 내 질문은 다양합니다. 다양한 매개 변수에 대한 데이터에서 D 는 정확히 어떻게 D추정됩니까? 우리가 가정하면 말 D (임의 효과와 무관) 또는 대각선 D 완전히 또는 여러 다른 매개 변수화의 (좀 더 순간에 관심이있어 사건을) 파라미터? 이것들에 대한 간단한 추정 / 방정식이 있습니까? (반복적으로 추정 될 것입니다.)

편집 : 책 Variance Components (Searle, Casella, McCulloch 2006)에서 나는 다음을 빛나게했습니다.

만약 D=σu2Iq 다음과 같이 후 분산 컴포넌트 업데이트 계산된다 :

σu2(k+1)=u^Tu^σu2(k)trace(V1ZTZ)

σe2(k+1)=Y(YXβ^(k)Zu^(k))/n

여기서 β^(케이)^(케이) 은 각각 케이 번째 업데이트입니다.

가 블록 대각선이거나 완전히 매개 변수화 될 때 일반 공식 이 있습니까? 완전히 매개 변수가 지정된 경우 Cholesky 분해가 긍정적 인 명확성과 대칭성을 보장하는 데 사용됩니다.


2
arxiv.org/pdf/1406.5823 (에서 언론 통계 소프트웨어의 저널 ) ... 유용 할 수 있습니다
벤 Bolker

답변:


8

Goldstein .pdf @probabilityislogic 링크는 훌륭한 문서입니다. 다음은 특정 질문에 대해 언급 한 참고 문헌 목록입니다.

Harville, 1976 : 가우스 마르코프 정리의 확장으로 랜덤 효과의 추정 포함 .

Harville, 1977 : 분산 성분 추정 및 관련 문제에 대한 최대 가능성 접근법 .

Laird and Ware, 1982 : 종단 데이터에 대한 랜덤 효과 모델 .

McCulloch, 1997 : 일반화 선형 혼합 모형에 대한 최대 우도 알고리즘 .

혼합 절차 SAS 사용자 안내서 발췌 공분산 추정 및 (페이지 3968부터) 더 많은 소스에 대한 몇 가지 좋은 정보가 있습니다.

이 종 / 반복 측정 데이터 분석에 다양한 품질의 교과서가 있지만, 여기에 (의 저자에서 R의 구현에 대한 몇 가지 내용이수록되어 하나 lme4nlme)

Pinheiro and Bates, 2000 : S와 S-PLUS의 혼합 효과 모델 .

편집 : 또 다른 관련 논문 : Lindstrom and Bates, 1988 : 반복 측정 데이터에 대한 선형 혼합 효과 모델에 대한 Newton-Raphson 및 EM 알고리즘 .

편집 2 : 그리고 다른 하나 : Jennrich and Schluchter, 1986 : 구조적 공분산 행렬을 사용한 불균형 반복 측정 모델 .


Pinheiro와 Bates, 특히 2 장 (이론과 계산에 대해)을 살펴 봤지만 공분산 구조가 어떻게 적용되고 평가되는지에 대해서는 아무것도 보이지 않는 것 같습니까? 나는 곧 다시 갈 것이다. 나는 단지 여기에 앉아있는 몇 가지 논문을 가지고 있습니다. 나는 반드시 다시 읽어야 할 것입니다. 건배.
dcl

1
@dcl P & B 2 장을 되돌아 보면 그들이 관심있는 단계 중 일부에 대해 글을 쓰고있는 것을 알 수 있습니다 (공분산 모수를 사용하여 로그 우도를 최적화하지만 방법을 말하지는 않습니다 ). 즉, 섹션 2.2.8은 귀하의 질문에 가장 적합한 섹션 일 수 있습니다.

1
@dcl 도움이 될만한 소스를 하나 더 추가했습니다.

링크 주셔서 감사합니다. 과거에이 논문들을 살펴 보았는데, 그들 중 일부는 저에게 아주 기술적 인 내용입니다. 나는 지금 그들을 통해 또 다른 찾아보기를 할 것이지만, 언뜻보기에는 내가 원하는 것을 얻을 수없는 것 같습니다.
dcl

1
@dcl 링크의 벽에 대해 죄송하지만 귀하의 질문은 한 사람이 몇 가지 강의를 논의 할 수있는 질문입니다 (혼합 효과 모델에 대해 처음 배울 때 양탄자 아래에 휩쓸리는 매우 좋은 질문입니다). 문헌을 살펴 보는 것 외에도 소스 코드를 lme4보고이 추정을 처리하는 방법 을 살펴 보는 것이 좋습니다 .

7

하비 골드 스타 인 은 시작하기에 나쁜 곳이 아닙니다.

대부분의 복잡한 추정 방법과 마찬가지로 소프트웨어 패키지에 따라 다릅니다. 그러나 종종 다음 단계가 수행됩니다.

  1. (예 : ) 및 (예 : ) 의 초기 값을 하십시오. 설정D 0 R R 00아르 자형아르 자형0나는=1
  2. 및 조건부에서 및 및 추정하십시오 . 추정치 및 및 호출하십시오 . R = R i - 1 β u ϵ β i u i ϵ i=나는1아르 자형=아르 자형나는1βϵβ나는나는ϵ나는
  3. 및 및 에 조건부로 와 추정하십시오 . 추정치 및 호출하십시오. u = u i ϵ = ϵ i D R D i R iβ=β나는=나는ϵ=ϵ나는아르 자형나는아르 자형나는
  4. 수렴을 확인하십시오. 수렴되지 않은 경우 하고 2 단계로 돌아갑니다.나는=나는+1

간단하고 빠른 방법 중 하나는 IGLS입니다.이 방법은 두 개의 최소 제곱 절차 사이의 반복을 기반으로하며 2 장에서 자세히 설명합니다. 단점은 0에 가까운 분산 성분에 대해서는 잘 작동하지 않는다는 것입니다.


나는 이것이 일반적인 방법이라는 것을 알고 있지만 D와 R은 어떻게 추정되며 다양한 구조에 어떤 방정식이 사용됩니까? 좋은 초기 값은 무엇입니까? 이제 PDF를 확인하겠습니다.
dcl


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.