일반화 선형 모형의 가정


9

"적용된 회귀에 대한 R 동반자"232 페이지 Fox 및 Weisberg note

가우시안 군만이 일정한 분산을 가지며, 다른 모든 GLM에서 에서 y의 조건부 분산은 에 따라 달라집니다xμ(x)

이전에는 포아송의 조건부 분산이 이고 이항 의 조건부 분산 이 이라는 점에 주목합니다 .μμ(1μ)N

가우시안의 경우 이것은 친숙하고 자주 확인되는 가정입니다 (동질성). 유사하게, 나는 포아송의 조건부 분산이 포아송 회귀의 가정으로 논의되는 경우가 종종 있는데, 이것이 위반되는 경우에 대한 구제책 (예를 들어, 음 이항, 0 팽창 등)도 있습니다. 그러나 나는 이항에 대한 조건부 분산이 로지스틱 회귀의 가정으로 논의 된 적이 없다. 작은 인터넷 검색에 대한 언급이 없습니다.

내가 여기서 무엇을 놓치고 있습니까?

@whuber의 의견 다음에 편집 :

제안 된대로 Hosmer & Lemeshow를보고 있습니다. 흥미롭고 왜 내가 (그리고 아마도 다른 사람들) 혼란스러워하는지 보여줍니다. 예를 들어, "가정"이라는 단어는 책의 색인에 없습니다. 또한 우리는 이것을 가지고 있습니다 (p. 175)

로지스틱 회귀 분석에서는 모형 적합이라는 가설 하에서 진단의 분포가 특정 제한된 설정에서만 알려져 있기 때문에 주로 시각적 평가에 의존해야합니다.

그것들은 꽤 많은 플롯을 보여 주지만, 추정 된 확률에 대한 다양한 잔차의 산점도에 집중합니다. 이러한 도표 (좋은 모델의 경우에도 OLS 회귀 분석에서 유사한 도표의 "불완전한"패턴 특성을 갖지 않으므로 판단하기가 더 어렵습니다.

R에서 plot.lm은 모델을 평가하기위한 훌륭한 기본 플롯 세트를 제공합니다. 로지스틱 회귀에 해당하는 패키지인지는 모르겠지만 패키지에 포함되어있을 수도 있습니다. 각 모델 유형마다 다른 플롯이 필요하기 때문일 수 있습니다. SAS는 PROC LOGISTIC에서 몇 가지 도표를 제공합니다.

이것은 확실히 혼란의 영역으로 보인다!


3
Hosmer & Lemeshow, Applied Logistic Regression 의 사본이있는 경우 "모델 적합도 평가"장을 확인하십시오. 이항의 조건부 분산이 모든 곳에 나타나고 거의 모든 GoF 테스트에서 명시 적으로 설명됩니다.
whuber

1
이항 가정은 실제 실험에 의해 부과된다고 생각합니다. 반응은 독립적 인 0/1이므로 이항 분포는 실제 실험을 모델링하는 유일한 것입니다. 반대로 카운트에 대한 포아송 분포의 가정은 현실적이지 않습니다.
Stéphane Laurent

1
감사합니다 @ whuber. 나는 그 책을 가지고 있고 그것을 확인할 것이다
Peter Flom

...하지만 링크 기능은 자연스럽지 않고 조건부 분산을 결정합니다 ... 그래서 위의 의견은 그리 합리적이지 않았습니다.
Stéphane Laurent

답변:


3

이러한 도표 (좋은 모델의 경우에도 OLS 회귀 분석에서 유사한 도표의 "불완전한"패턴 특성을 갖지 않으므로 판단하기가 더 어렵습니다.

오뚝이 R 패키지 해결하는 표준화 된 공간에있는 GL (M) M의 잔차를 변환 피팅 모델이 시뮬레이션에 의한 문제. 이것이 완료되면, 잔류 문제를 시각적으로 그리고 공식적으로 평가하기위한 모든 규칙적인 방법 (예 : qq 도표,과 분산, 이분산성, 자기 상관)을 적용 할 수 있습니다. 실습 예제 는 패키지 비 네트 를 참조하십시오 .

@Otto_K의 의견과 관련하여, 균일 한 과분 산이 유일한 문제라면 표준 이항 GLMM으로 구현할 수있는 관측 수준의 랜덤 효과를 사용하는 것이 더 간단 할 것입니다. 그러나 @PeterFlom은 이분산성, 즉 일부 예측 변수 또는 모델 예측에 따른 분산 매개 변수의 변경에 대해서도 우려하고 있다고 생각합니다. 이것은 표준과 분산 점검 / 수정으로 픽업 / 수정되지 않지만 DHARMa 잔차 플롯에서 볼 수 있습니다. 이를 수정하기 위해 JAGS 또는 STAN의 다른 기능으로 분산을 모델링하는 것이 현재 유일한 방법 일 것입니다.


1

설명하는 주제를 과대 산포 라고 합니다. 내 작품에서 나는 그런 주제에 대한 가능한 해결책을 보았습니다.

베이지안 접근법을 사용하고 베타-이항 분포를 추정합니다. 이것은 폐쇄 형 솔루션을 갖는 다른 분배 (다른 사전에 의해 유도 된)에 큰 이점이 있습니다.

참고 문헌 :

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.