GLM과 GEE의 차이점은 무엇입니까?


9

피험자와 시간을 공변량으로 포함하는 이진 반응 변수가 포함 된 GLM 모델 (물류 회귀)과 여러 시점의 측정 간 상관 관계를 고려한 유사한 GEE 모델의 차이점은 무엇입니까?

내 GLM은 다음과 같습니다.

Y(binary) ~ A + B1X1(subject id) + B2X2(time) 
              + B3X3(interesting continuous covariate)

로짓 링크 기능.

나는 두 모델에서 시간이 어떻게 다르게 취급되는지와 해석에 대한 의미가 무엇인지에 대한 간단한 (사회 과학자를 겨냥한) 설명을 찾고 있습니다.


6
관련 질문에 대한 답변 ( 일반화 추정 방정식과 GLMM의 차이점은 무엇입니까? , 일반화 추정 방정식을 사용하는 경우와 혼합 효과 모델을 사용할 때? )은 매우 포괄적이지만, 무작위 효과 대 GEE가있는 GLM에 관한 것 입니다.
Chl

1
연속 공변량으로 주제 ID를 정말로 맞추시겠습니까? 응답 변수를 id의 증가 또는 감소 함수로 만드는 것이 이상하게 보입니다.
손님

인구 평균 효과 대 주제별 효과.

다음은이 둘의 차이점을 설명하는 기사에 대한 링크입니다. aje.oxfordjournals.org/content/147/7/694.full.pdf+html
Will

1
@chl이 위의 질문에 링크하는 것 외에도이 질문은 다음 아이디어를 논의합니다 . SPSS의 일반화 선형 모형과 일반화 선형 혼합 모형의 차이점 .
gung-복직 모니카

답변:


12

거기에 더 좋고 자세한 답변이있을 수 있지만 간단하고 빠른 생각을 할 수 있습니다. 여러 시점에서 일부 주제에서 수집 한 데이터에 맞추기 위해 일반화 된 선형 모형 (예 : 일반적인 로지스틱 회귀)을 사용하는 것에 대해 이야기하는 것 같습니다. 처음에는 홍당무 가이 접근법에 두 가지 눈부신 문제가 있습니다.

먼저,이 모형은 공변량을 고려할 때 (즉, 각 주제에 대한 더미 코드를 고려한 후 개별 절편 항과 유사하며 선형 시간 추세가 모두 동일 함) 데이터가 독립적이라고 가정합니다. 이것은 사실이 아닐 것입니다. 대신, 자기 상관이 거의있을 것입니다. 예를 들어, 동일한 개별 시간에 더 가까운 두 개의 관측치가 시간 을 고려한 후에도 시간이 더 멀리 떨어진 두 개의 관측치보다 더 유사 합니다 . (만약 당신이 subject ID x time상호 작용 (즉, 모두에게 독특한 시간 추세)을 포함한다면 그것들은 독립적 일 수 있지만, 이것은 다음 문제를 악화시킬 것입니다.)

둘째, 각 참가자의 매개 변수를 추정하는 엄청난 자유도를 태울 것입니다. 관심있는 매개 변수를 정확하게 추정 할 수있는 자유도가 상대적으로 적을 수 있습니다 (물론, 이는 한 사람당 몇 개의 측정 값에 따라 달라집니다).

아이러니하게도 첫 번째 문제는 신뢰 구간이 너무 좁다는 것을 의미하고 두 번째 문제는 CI가 대부분의 자유도를 낭비하지 않았을 때보 다 CI가 훨씬 넓다는 것을 의미합니다. 그러나 나는이 두 가지가 서로 균형을 이루지 않을 것이라고 생각합니다. 가치가있는 것으로, 귀하의 매개 변수 추정치는 편향되지 않을 것이라고 믿습니다 (여기서는 내가 틀릴 수도 있음).

이 경우 일반화 된 추정 방정식을 사용하는 것이 적절합니다. GEE를 사용하여 모형을 적합화할 때 상관 구조 (예 : AR (1)) 를 지정하면 공변량 지정한 상관 행렬 모두 에서 데이터가 독립적으로 조건부로 적용되는 것이 매우 합리적입니다 . 또한 GEE는 모집단 평균 연관성을 추정하므로 각 참가자에 대해 자유도를 태울 필요가 없습니다.

해석에 관해서는 내가 아는 한 두 경우 모두 동일합니다. 다른 요인이 일정하게 유지되면 X3의 1 단위 변화는 '성공'에 대한 로그 확률의 B3 변화와 관련이 있습니다. .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.