공변량의 개체 평균 효과 대 개별 특정 효과를 알아 내려면 GEE를 사용하십시오. 이 두 가지는 선형 모델에서만 동일하지만 비선형 (예 : 물류)에서는 아닙니다. 이를 확인하려면 예를 들어 번째 주제 의 번째 관측치 인 ;jiYij
log(pij1−pij)=μ+ηi
여기서 는 주제 대해 무작위 효과 이며 입니다.ηi∼N(0,σ2)ipij=P(Yij=1|ηi)
이 데이터에 대해 랜덤 효과 모델을 사용한 경우, 정규 분포가 평균적으로 분산 된 평균 0이 각 개인에 적용되어 개인별로 특정한다는 사실을 설명하는 의 추정치를 얻을 수 있습니다.μ
이러한 데이터에 GEE를 사용한 경우 모집단 평균 로그 확률을 추정 할 수 있습니다. 이 경우에는
ν=log⎛⎝⎜Eη(11+e−μ−ηi)1−Eη(11+e−μ−ηi)⎞⎠⎟
ν≠μ일반적으로 입니다. 예를 들어, 이고 이면 입니다. 변환 된 (또는 연결된 ) 스케일 에서 랜덤 효과의 평균은 0이지만, 데이터의 원래 스케일에서 효과는 0이 아닙니다. 혼합 효과 로지스틱 회귀 모델에서 일부 데이터를 시뮬레이션하고 모집단 수준 평균을 절편의 역 로짓과 비교하면이 예와 같이 데이터가 같지 않음을 알 수 있습니다. 계수 해석의 차이는 GEE와 랜덤 효과 모델의 근본적인 차이 입니다.μ=1σ2=1ν≈.83
편집 : 일반적으로 예측 변수가없는 혼합 효과 모델은 다음과 같이 작성할 수 있습니다.
ψ(E(Yij|ηi))=μ+ηi
여기서 는 링크 함수입니다. 할때는 언제나ψ
ψ(Eη(ψ−1(E(Yij|ηi))))≠Eη(E(Yij|ηi))
모집단 평균 계수 (GEE)와 개별 특정 계수 (랜덤 효과 모델)간에 차이가 있습니다. 즉, 데이터를 변환하고 변환 된 스케일에 임의 효과를 통합 한 다음 다시 변환하여 평균이 변경됩니다. 선형 모형 (즉, )에서 동등성은 유지되므로 동등합니다.ψ(x)=x
편집 2 : 또한 GEE 모델에 의해 생성 된 "견고한"샌드위치 유형 표준 오류는 모델에 지정된 상관 관계 구조가 아닌 경우에도 유효한 점근 적 신뢰 구간을 제공합니다 (예 : 실제로 시간의 95 %를 커버 함). 옳은.
편집 3 : 데이터의 연관 구조를 이해하는 데 관심이 있다면 연관의 GEE 추정치가 비효율적이며 때로는 불일치합니다. 이것에 대한 참조를 보았지만 지금 배치 할 수는 없습니다.