일반화 선형 모형과 일반화 선형 혼합 모형의 차이점


34

혼합 GLM과 혼합 GLM의 차이점이 무엇인지 궁금합니다. 예를 들어 SPSS에서 드롭 다운 메뉴를 사용하면 다음 중 하나에 맞출 수 있습니다.

  • analyze-> generalized linear models-> generalized linear models &
  • analyze-> mixed models-> generalized linear

결 측값을 다르게 처리합니까?

내 종속 변수는 이진이며 여러 범주적이고 연속적인 독립 변수가 있습니다.


답변:


62

일반화 된 선형 모델 의 출현으로 응답 변수의 분포가 비정규 인 경우 (예 : DV가 이진 인 경우) 회귀 형 데이터 모델을 만들 수있었습니다. GLiM에 대해 조금 더 알고 싶다면 여기에 상당히 광범위한 답변을 작성했는데 상황에 따라 유용 할 수 있습니다. 그러나 로지스틱 회귀 모델과 같은 GLiM은 데이터가 독립적 이라고 가정합니다 . 예를 들어, 어린이가 천식을 앓고 있는지를 조사한 연구를 상상해보십시오. 각 어린이는 하나를 기여데이터는 연구를 가리키며 천식이 있거나 그렇지 않은 것으로 나타났습니다. 때로는 데이터가 독립적이지 않습니다. 한 학년 동안 아이가 여러 가지 점에서 감기에 걸 렸는지 여부를 조사하는 다른 연구를 고려하십시오. 이 경우 각 자식은 많은 데이터 요소를 제공합니다. 언젠가 아이는 감기에 걸렸고 나중에는 감기에 걸렸을 수도 있고 나중에는 또 다른 감기에 걸렸을 수도 있습니다. 이 데이터는 같은 자녀에게서 왔기 때문에 독립적이지 않습니다. 이러한 데이터를 적절하게 분석하려면 이러한 비 독립성을 고려해야합니다. 두 가지 방법이 있습니다. 한 가지 방법은 일반화 된 추정 방정식 을 사용하는 것입니다 (이는 언급하지 않으므로 생략하겠습니다). 다른 방법은 일반화 된 선형 혼합 모형 을 사용하는 것입니다. GLiMM은 @MichaelChernick 메모와 같이 임의의 효과를 추가하여 비 독립성을 설명 할 수 있습니다. 따라서 두 번째 옵션은 비정규 반복 측정 (또는 비 독립적) 데이터에 대한 것입니다. ( @Macro 의 의견에 따르면, 일반화 선형 혼합 모형에는 특수 사례로 선형 모형이 포함되므로 정규 분포 데이터와 함께 사용할 수 있습니다. 그러나 일반적인 사용법에서이 용어는 비정규 데이터를 의미합니다.)

업데이트 : (OP는 GEE에 대해서도 물었으므로 세 가지가 서로 어떻게 관련되는지에 대해 조금 쓸 것입니다.)

기본 개요는 다음과 같습니다.

  • 일반적인 GLiM (로지스틱 회귀를 프로토 타입 사례로 사용함)을 사용하면 공변량의 함수로 독립 이항 반응 을 모델링 할 수 있습니다.
  • GLMM을 사용하면 공변량의 함수로 각 개별 군집의 속성에 따라 비 독립 (또는 군집) 이진 반응 을 모델링 할 수 있습니다.
  • 저런 당신이 모델링 할 수 있습니다 인구 평균 응답비 독립적 공변량의 함수로 바이너리 데이터를

참가자 당 여러 번의 평가판이 있으므로 데이터는 독립적이지 않습니다. 정확하게 알 수 있듯이 "한 참가자 내에서의 시련은 전체 그룹에 비해 더 유사 할 것입니다." 따라서 GLMM 또는 GEE를 사용해야합니다.

문제는 GLMM 또는 GEE가 귀하의 상황에 더 적합한 지 여부를 선택하는 방법입니다. 이 질문에 대한 답은 연구 주제, 특히 당신이 원하는 추론의 목표에 달려 있습니다. 위에서 언급했듯이 GLMM을 사용하면 베타는 개별 특성을 고려할 때 특정 참가자에게 공변량의 한 단위 변화가 미치는 영향에 대해 알려줍니다. 반면에 GEE와 함께 베타는 해당 집단 전체의 평균 반응에 대한 공변량의 한 단위 변화의 영향에 대해 알려줍니다. 이것은 선형 모델과의 구별이 없기 때문에 파악하기 어려운 구별입니다 (이 경우 두 가지가 동일합니다).

logit(pi)=β0+β1X1+bi
logit(p)=ln(p1p),     &      bN(0,σb2)
p β0(β0+bi)biβ0β1pilogit여기에 이미지 설명을 입력하십시오
β1-각 학생마다 동일합니다 (즉, 임의의 기울기가 없습니다). 그러나 학생들의 기준선 능력은 IQ와 같은 것의 차이 (즉, 임의의 가로 채기가 있음) 때문에 차이가 있습니다. 그러나 학급 전체의 평균 확률은 학생과 다른 프로파일을 따릅니다. 직관적으로 반 직관적 인 결과는 다음과 같습니다 . 추가 1 시간의 수업은 학생이 시험을 통과 할 확률에 상당한 영향을 줄 수 있지만 합격 한 전체 학생 비율에는 거의 영향을 미치지 않습니다 . 일부 학생들은 이미 합격 가능성이 높았지만 다른 학생들은 아직 기회가 거의 없었기 때문입니다.

GLMM을 사용해야하는지 아니면 GEE를 사용해야하는지에 대한 질문은 이러한 기능 중 어떤 기능을 추정 할 것인지에 대한 질문입니다. 당신이 (예를 들어, 당신이 경우 해당 학생 통과의 가능성에 대해 알고 싶다면 있었다 학생 또는 학생의 부모), 당신은 GLMM를 사용하고 싶습니다. 반면에, 인구에 미치는 영향에 대해 알고 싶다면 (예를 들어 교사 또는 교장 인 경우) GEE를 사용하고 싶을 것입니다.

이 자료에 대한 수학적으로 더 자세한 또 다른 논의는 @Macro의 답변 을 참조하십시오 .


2
이것은 좋은 대답이지만 특히 마지막 문장은 일반적인 가우시안 선형 (혼합) 모델이 GL (M) M 카테고리.
매크로

@ 매크로, 당신 말이 맞아, 난 항상 잊어. 이것을 명확히하기 위해 답을 편집했습니다. 더 필요하다고 생각되면 알려주십시오.
gung-모니 티 복원

또한 일반화 된 추정 방정식도 확인했습니다. GLiM과 마찬가지로 GEE는 내 데이터가 독립적이라고 가정합니까? 참가자 당 여러 번의 평가판이 있습니다. 한 참가자의 시험은 전체 그룹에 비해 더 유사 할 것입니다.
user9203

@gung, GEE가 "인구 평균"계수를 생성 할 수 있지만 실제 모집단의 확률 척도에서 평균 치료 효과 (ATE) 를 추정하려면 이진 회귀 분석을 위해 주제별 접근법? 내가 아는 한, ATE를 계산하는 방법은 치료 유무에 관계없이 각 사람의 예측 확률을 추정 한 다음 그 차이를 평균하는 것입니다. 이것이 각 사람에 대해 예측 된 확률을 생성 할 수있는 회귀 분석법을 필요로하지 않습니까 (평균치가 초과 되어도)?
Yakkanomica

1
@Yakkanomica, 그것이 당신이 원하는 것이라면, 확실합니다.
gung-복직 모니카

6

핵심은 무작위 효과의 도입입니다. Gung의 링크에서 언급합니다. 그러나 나는 그것이 직접 언급되어야한다고 생각합니다. 이것이 주요 차이점입니다.


+1, 그렇습니다. 나는 그것에 대해 더 분명해야했다. 이 요점을 포함하도록 답변을 편집했습니다.
gung-모니 티 복원

모델에 임의의 가로 채기와 같은 임의의 효과를 추가 할 때마다 오류 메시지가 나타납니다. 무작위 효과를 추가하기에 충분한 데이터 포인트가 없다고 생각합니다. 그럴 수 있습니까? 오류 메시지 : glmm : 모든 수렴 기준이 충족되었지만 최종 Hessian 행렬이 양의 한정이 아닙니다. 이 경고에도 불구하고 절차는 계속됩니다. 후속 결과는 마지막 반복을 기반으로합니다. 모형 적합의 유효성이 확실하지 않습니다.
user9203

3

또한 얼마 전에 내가 물었던 질문에 대한 답변도 검토 할 것을 제안합니다.

일반 선형 모형과 일반 선형 모형 (식별 링크 기능이 있는가?)


5
GLM 및 혼합 효과 모델을 실행하는 SPSS 기능과 결 측값을 처리하는 방법에 관한 질문에 실제로 대답하지는 않습니다. 이것은 대신 주석이 되었습니까? 그렇지 않으면, 명확히하십시오.
chl

죄송합니다, 오프닝 포스트는 두 개의 "질문"을 가지고있는 것 같습니다. 1. 나는 무엇을 궁금해하고 있습니다 .... 그리고 2. 그들은 결 측값을 다르게 취급합니까? 첫 번째 질문에 도움을 주려고 노력했습니다.
Behacad

1
충분합니다. 추가 설명이 없으면 OP에 대한 의견으로 더 적합하다고 생각합니다.
chl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.