glm 모델에 대한 잔류 진단 플롯을 해석 하시겠습니까?


33

glm 모델의 잔차 그림을 해석하는 방법에 대한 지침을 찾고 있습니다. 특히 포아송, 음 이항, 이항 모델입니다. 모형이 "정확한"경우 이러한 도표에서 무엇을 기대할 수 있습니까? (예를 들어, 포아송 모델을 다룰 때 예측값이 증가함에 따라 분산이 커질 것으로 예상합니다)

답은 모델에 따라 다릅니다. 모든 참조 (또는 고려해야 할 일반적인 사항)가 도움이 될 것입니다.

답변:


16

이것이 회귀 분석을 할 때 가장 어려운 부분 중 하나라고 생각합니다. 또한 대부분의 해석으로 어려움을 겪습니다 (특히 이항 진단은 미쳤습니다!).

방금이 게시물 http://www.r-bloggers.com/model-validation-interpreting-residual-plots/ 를 우연히 발견 한 http://statmaster.sdu.dk/courses/st111/module04/index.html # SECTION00020000000000000000

가장 도움이되는 것은 잔차 대 모델에 포함되지 않은 모든 예측 매개 변수를 플로팅하는 것입니다. 이것은 또한 다중 공선 성으로 인해 사전에 삭제 된 사람들을 의미합니다. 이 상자 그림의 경우 조건부 산점도와 정규 산점도가 좋습니다. 가능한 오류를 발견하는 데 도움이됩니다.

"R을 사용한 포리스트 분석"(UseR 시리즈)에는 혼합 효과 모델 (및 glm)의 잔차를 해석하는 방법에 대한 좋은 설명이 있습니다. 잘 읽어보세요! http://www.springer.com/statistics/life+sciences,+medicine+%26+health/book/978-1-4419-7761-8

언젠가 나는 사용자가 "좋아"하고 "좋지 않다"라고 투표 할 수있는 잔여 패턴을 수집 할 수있는 웹 사이트에 대해 생각했습니다. 그러나 나는 그 웹 사이트를 찾지 못했습니다.)


8

나는 다음에 설명 된 방법을 제안 할 것이다.

 Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne,
 D.F and Wickham, H. (2009) Statistical Inference for exploratory
 data analysis and model diagnostics Phil. Trans. R. Soc. A 2009
 367, 4361-4383 doi: 10.1098/rsta.2009.0120

몇 가지 다른 아이디어가 있지만 실제 관계가 무엇인지 알고 해당 관계가 실제 데이터 분석을 기반으로하는 데이터를 시뮬레이션하는 데 주로 사용됩니다. 그런 다음 실제 데이터의 진단을 시뮬레이션 된 데이터 세트의 진단과 비교합니다. vis.testR 용 TeachingDemos 패키지 의 기능은 논문에서 제안 된 1 가지 변형을 구현합니다. 더 나은 이해를 위해 전체 논문 (단순한 요약이 아니라)을 읽으십시오.


나는 그것이 산포 또는 다른 음모에서 무작위로 벗어난 패턴을 보는 것에 대한 좋은 제안이라고 생각하지만 잔차를 볼 때 유일한 목표는 아닙니다. 종종 우리는 임의의 편차 (예를 들어, 이분산성, 모델에서 잘못 지정된 비선형 성, 생략 된 변수, 이상치 또는 높은 레버리지 값 등)에 관심이 있습니다. 무작위로 생성 된 데이터와의 비교는 잔차가 무작위가 아니며 치료법이 아닌 이유를 식별하는 데 실제로 도움이되지 않습니다.
Andy W

@AndyW, 우리는 원래 질문을 다르게 해석한다고 생각합니다. 내 대답은 연구원들이 더 많은 것을 찾거나 잔류 그림이 합리적인지 알려 주어 연구원을 시작시킵니다. 그것이 합리적으로 보이지 않으면 다음 단계와 내 대답을 넘어서는 것입니다 (새로운 시뮬레이션을 사용하여 추가 가정을 비교할 수는 있지만).
Greg Snow

5

이 질문은 상당히 오래되었지만 최근에 DHARMa R 패키지 를 사용하여 GL (M) M의 잔차를 표준화 된 공간으로 변환 할 수 있다는 점을 추가하는 것이 유용하다고 생각했습니다 . 이 작업이 완료되면 분포 편차, 예측 변수의 잔존 종속성, 이분산성 또는 자기 상관과 같은 잔차 문제를 시각적으로 평가 / 테스트 할 수 있습니다. 실습 예제 와 CV에 대한 다른 질문은 여기여기 에서 패키지 비 네트 를 참조 하십시오 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.