일반화 된 선형 모델 의 출현으로 응답 변수의 분포가 비정규 인 경우 (예 : DV가 이진 인 경우) 회귀 형 데이터 모델을 만들 수있었습니다. GLiM에 대해 조금 더 알고 싶다면 여기에 상당히 광범위한 답변을 작성했는데 상황에 따라 유용 할 수 있습니다. 그러나 로지스틱 회귀 모델과 같은 GLiM은 데이터가 독립적 이라고 가정합니다 . 예를 들어, 어린이가 천식을 앓고 있는지를 조사한 연구를 상상해보십시오. 각 어린이는 하나를 기여데이터는 연구를 가리키며 천식이 있거나 그렇지 않은 것으로 나타났습니다. 때로는 데이터가 독립적이지 않습니다. 한 학년 동안 아이가 여러 가지 점에서 감기에 걸 렸는지 여부를 조사하는 다른 연구를 고려하십시오. 이 경우 각 자식은 많은 데이터 요소를 제공합니다. 언젠가 아이는 감기에 걸렸고 나중에는 감기에 걸렸을 수도 있고 나중에는 또 다른 감기에 걸렸을 수도 있습니다. 이 데이터는 같은 자녀에게서 왔기 때문에 독립적이지 않습니다. 이러한 데이터를 적절하게 분석하려면 이러한 비 독립성을 고려해야합니다. 두 가지 방법이 있습니다. 한 가지 방법은 일반화 된 추정 방정식 을 사용하는 것입니다 (이는 언급하지 않으므로 생략하겠습니다). 다른 방법은 일반화 된 선형 혼합 모형 을 사용하는 것입니다. GLiMM은 @MichaelChernick 메모와 같이 임의의 효과를 추가하여 비 독립성을 설명 할 수 있습니다. 따라서 두 번째 옵션은 비정규 반복 측정 (또는 비 독립적) 데이터에 대한 것입니다. ( @Macro 의 의견에 따르면, 일반화 선형 혼합 모형에는 특수 사례로 선형 모형이 포함되므로 정규 분포 데이터와 함께 사용할 수 있습니다. 그러나 일반적인 사용법에서이 용어는 비정규 데이터를 의미합니다.)
업데이트 : (OP는 GEE에 대해서도 물었으므로 세 가지가 서로 어떻게 관련되는지에 대해 조금 쓸 것입니다.)
기본 개요는 다음과 같습니다.
- 일반적인 GLiM (로지스틱 회귀를 프로토 타입 사례로 사용함)을 사용하면 공변량의 함수로 독립 이항 반응 을 모델링 할 수 있습니다.
- GLMM을 사용하면 공변량의 함수로 각 개별 군집의 속성에 따라 비 독립 (또는 군집) 이진 반응 을 모델링 할 수 있습니다.
- 저런 당신이 모델링 할 수 있습니다 인구 평균 응답 의 비 독립적 공변량의 함수로 바이너리 데이터를
참가자 당 여러 번의 평가판이 있으므로 데이터는 독립적이지 않습니다. 정확하게 알 수 있듯이 "한 참가자 내에서의 시련은 전체 그룹에 비해 더 유사 할 것입니다." 따라서 GLMM 또는 GEE를 사용해야합니다.
문제는 GLMM 또는 GEE가 귀하의 상황에 더 적합한 지 여부를 선택하는 방법입니다. 이 질문에 대한 답은 연구 주제, 특히 당신이 원하는 추론의 목표에 달려 있습니다. 위에서 언급했듯이 GLMM을 사용하면 베타는 개별 특성을 고려할 때 특정 참가자에게 공변량의 한 단위 변화가 미치는 영향에 대해 알려줍니다. 반면에 GEE와 함께 베타는 해당 집단 전체의 평균 반응에 대한 공변량의 한 단위 변화의 영향에 대해 알려줍니다. 이것은 선형 모델과의 구별이 없기 때문에 파악하기 어려운 구별입니다 (이 경우 두 가지가 동일합니다).
로짓 ( P나는) = β0+ β1엑스1+ b나는
로짓 ( p ) = ln( p1 - p) ,&b∼ N ( 0 , σ2비)
피 β0( β0+ b나는)비나는β0β1pilogitβ1-각 학생마다 동일합니다 (즉, 임의의 기울기가 없습니다). 그러나 학생들의 기준선 능력은 IQ와 같은 것의 차이 (즉, 임의의 가로 채기가 있음) 때문에 차이가 있습니다. 그러나 학급 전체의 평균 확률은 학생과 다른 프로파일을 따릅니다. 직관적으로 반 직관적 인 결과는 다음과 같습니다
. 추가 1 시간의 수업은 각 학생이 시험을 통과 할 확률에 상당한 영향을 줄 수 있지만 합격 한 전체 학생 비율에는 거의 영향을 미치지 않습니다 . 일부 학생들은 이미 합격 가능성이 높았지만 다른 학생들은 아직 기회가 거의 없었기 때문입니다.
GLMM을 사용해야하는지 아니면 GEE를 사용해야하는지에 대한 질문은 이러한 기능 중 어떤 기능을 추정 할 것인지에 대한 질문입니다. 당신이 (예를 들어, 당신이 경우 해당 학생 통과의 가능성에 대해 알고 싶다면 있었다 학생 또는 학생의 부모), 당신은 GLMM를 사용하고 싶습니다. 반면에, 인구에 미치는 영향에 대해 알고 싶다면 (예를 들어 교사 또는 교장 인 경우) GEE를 사용하고 싶을 것입니다.
이 자료에 대한 수학적으로 더 자세한 또 다른 논의는 @Macro의 답변 을 참조하십시오 .