선형 혼합 모형에서 잔차의 잔차 진단 및 균질성


10

이 질문을하기 전에, 나는 우리 사이트를 검색하고 비슷한 질문을 많이 찾았습니다 ( 여기 , 여기 , 여기 ). 그러나 관련 질문에 대한 답변이나 토론이 제대로 이루어지지 않았다고 생각하여 다시 질문을 제기하고 싶습니다. 이런 종류의 질문에 대해보다 명확하게 설명하기를 원하는 많은 사람들이 있어야한다고 생각합니다.

제 질문은 제 선형 혼합 효과 모델을 고려

y=Xβ+Zγ+ϵ
여기서 Xβ 선형 고정 효과 성분이다 Z 상기 대응하는 추가적인 설계 행렬 랜덤 효과 파라미터 , γ . 그리고 ϵ  N(0,σ2I) 일반적인 에러 항이다.

유일하게 고정 효과 인자가 3 가지 레벨을 갖는 범주 형 변수 처리 라고 가정하자 . 그리고 임의의 랜덤 효과 요인은 변수 Subject 입니다. 즉, 우리는 고정 치료 효과와 무작위 대상 효과를 가진 혼합 효과 모델을 가지고 있습니다.

내 질문은 다음과 같습니다

  1. 선형 혼합 모형 설정에서 기존 선형 회귀 모형과 유사한 분산 가정의 동질성이 있습니까? 그렇다면 위에서 언급 한 선형 혼합 모형 문제와 관련하여 가정이 구체적으로 의미하는 것은 무엇입니까? 평가해야 할 다른 중요한 가정은 무엇입니까?

내 생각 : 예. 가정 (즉, 오류 평균이 0이고 분산이 같음)은 여전히 ϵ  N(0,σ2I) 입니다. 전통적인 선형 회귀 모델 설정에서 우리는 "오류의 분산 (또는 종속 변수의 분산)이 3 가지 처리 수준에서 일정하다"고 가정 할 수 있습니다. 그러나 혼합 모델 설정 에서이 가정을 설명하는 방법을 잃어 버렸습니다. "변이가 3 가지 수준의 치료, 피험자에 대한 컨디셔닝에 걸쳐 일정합니까?"라고 말해야합니까?

  1. 잔차와 영향력 진단에 대한 SAS 온라인 문서는 두 개의 서로 다른 잔차, 즉, 제기 한계 잔차 , 와 조건부 잔류 , 내 질문은 두 잔차가 무엇에 사용됩니까? 균질성 가정을 확인하기 위해 어떻게 사용할 수 있습니까? 나에게, 한계 잔차 만이 모형 의 에 대응하기 때문에 동질성 문제를 해결하는데 사용될 수있다 . 내 이해가 맞습니까?

    rm=YXβ^
    rc=YXβ^Zγ^=rmZγ^.
    ϵ
  2. 선형 혼합 모형에서 동질성 가정을 테스트하기 위해 제안 된 테스트가 있습니까? @Kam은 이전에 levene의 테스트를 지적했는데 이것이 올바른 방법일까요? 그렇지 않은 경우 방향은 무엇입니까? 혼합 모형을 적합시킨 후 잔차를 구할 수 있으며 적합도 검정과 같은 일부 검정을 수행 할 수 있지만 어떻게 될지 잘 모르겠습니다.

  3. 또한 SAS의 Proc Mixed에서 3 가지 유형의 잔차, 즉 Raw 잔차 , Studentized 잔차Pearson 잔차 가 있음을 알았습니다 . 수식 측면에서 차이점을 이해할 수 있습니다. 그러나 나에게는 실제 데이터 플롯과 관련하여 매우 비슷한 것처럼 보입니다. 실제로 어떻게 사용해야합니까? 한 유형이 다른 유형보다 선호되는 상황이 있습니까?

  4. 실제 데이터 예의 경우 다음 두 가지 잔차 그림은 SAS의 Proc Mixed에서 가져온 것입니다. 분산의 동질성 가정을 어떻게 해결할 수 있습니까?

[여기에 몇 가지 질문이 있습니다. 당신이 어떤 질문에 당신의 생각을 나에게 제공 할 수 있다면, 그것은 좋습니다. 당신이 할 수 없다면 그들 모두를 다룰 필요가 없습니다. 나는 완전히 이해하기 위해 그들에 대해 토론하고 싶습니다. 감사!]

다음은 한계 (원시) 잔차 그림입니다. 다음은 한계 (원시) 잔차 그림입니다.

다음은 조건부 (원시) 잔차 그림입니다. 다음은 조건부 (원시) 잔차 그림입니다.


훌륭한 질문-2 번에 대한 답변은 comp.soft-sys.sas.narkive.com/7Qmrgufe/…
dandar

답변:


3

질문 1과 2가 서로 연결된 것 같습니다. 먼저 분산 가정의 동질성, 여기서는 입니다. 그러나이 가정은 균질성 가정이 필요하지 않은보다 일반적인 분산 구조로 완화 될 수 있습니다. 이것은 의 분포가 어떻게 가정 되는지에 달려 있다는 것을 의미합니다 .ϵ  N(0,σ2I)ϵ

둘째, 조건부 잔차 는 의 분포를 확인하는 데 사용되는 반면, 한계 잔차 는 총 분산 구조를 확인하는 데 사용할 수 있습니다.ϵ


@AaronZeng과 동일한 문제에 직면하고 있습니다. 한계 잔차를 사용해야하는 "총 분산 구조 확인"이란 무엇입니까? 이것에 대해 어떻게 생각하고 왜 의 분산 구조를 확인하는 데 초점을 맞추지 않습니까? 감사합니다. γ
clarpaul

1

이것은 매우 광범위한 주제이며 표준 선형 회귀와의 연결에 대한 일반적인 그림 만 제공합니다.

질문에 기재된 모델에서, 의 경우 에서 는 주제 또는 클러스터를 나타냅니다. 하자 . Cholesky 분해 하여 결과 및 설계 행렬을 변환 할 수 있습니다.

yiN(Xiβ,ZiDZi+σ2I),
γiN(0,D)iΣi=ZiDZi+σ2IΣi=LiLi
yi=Li1yi;Xi=Li1Xi.

Applied Longitudinal Analysis (페이지 268) 에서 언급했듯이 ( 에서 회귀 )의 일반화 된 최소 제곱 (GLS) 추정값 은 의 OLS 회귀에서 재 추정 될 수 있습니다 에 . 따라서 결과 OLS의 모든 내장 잔차 진단을 여기에서 사용할 수 있습니다 .βyiXiyiXi

우리가해야 할 일은 :

  1. 선형 혼합 모형의 (마진) 잔차 또는 분산 성분 추정값으로부터 추정값 ;Σi
  2. 변환 된 데이터를 사용하여 OLS 회귀를 다시 피팅합니다.

OLS 회귀 분석은 동종 분산으로 독립적 인 관측을 가정하므로 표준 진단 기술을 잔차에 적용 할 수 있습니다.

훨씬 자세한 내용은 Applied Longitudinal Analysis 책의 10 장 "잔여 분석 및 진단"에서 찾을 수 있습니다 . 또한 잔차 변환에 대해 논의 , (변형 된) 잔차 (예측 값 또는 예측 변수)에 대한 도표가 있습니다. 더 많은 판독 값이 10.8 "추가 판독 값"및 서지 정보에 나열되어 있습니다.Li

또한 내 의견으로는 이 균질 분산과 독립적이라고 가정하면 표준 회귀 도구를 사용하여 조건부 잔차에 대한 이러한 가정을 테스트 할 수 있습니다.ϵ


이 주제에 대한 인쇄 용지뜨겁게하십시오 .
Randel
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.