답변:
이것이 회귀 분석을 할 때 가장 어려운 부분 중 하나라고 생각합니다. 또한 대부분의 해석으로 어려움을 겪습니다 (특히 이항 진단은 미쳤습니다!).
방금이 게시물 http://www.r-bloggers.com/model-validation-interpreting-residual-plots/ 를 우연히 발견 한 http://statmaster.sdu.dk/courses/st111/module04/index.html # SECTION00020000000000000000
가장 도움이되는 것은 잔차 대 모델에 포함되지 않은 모든 예측 매개 변수를 플로팅하는 것입니다. 이것은 또한 다중 공선 성으로 인해 사전에 삭제 된 사람들을 의미합니다. 이 상자 그림의 경우 조건부 산점도와 정규 산점도가 좋습니다. 가능한 오류를 발견하는 데 도움이됩니다.
"R을 사용한 포리스트 분석"(UseR 시리즈)에는 혼합 효과 모델 (및 glm)의 잔차를 해석하는 방법에 대한 좋은 설명이 있습니다. 잘 읽어보세요! http://www.springer.com/statistics/life+sciences,+medicine+%26+health/book/978-1-4419-7761-8
언젠가 나는 사용자가 "좋아"하고 "좋지 않다"라고 투표 할 수있는 잔여 패턴을 수집 할 수있는 웹 사이트에 대해 생각했습니다. 그러나 나는 그 웹 사이트를 찾지 못했습니다.)
나는 다음에 설명 된 방법을 제안 할 것이다.
Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne, D.F and Wickham, H. (2009) Statistical Inference for exploratory data analysis and model diagnostics Phil. Trans. R. Soc. A 2009 367, 4361-4383 doi: 10.1098/rsta.2009.0120
몇 가지 다른 아이디어가 있지만 실제 관계가 무엇인지 알고 해당 관계가 실제 데이터 분석을 기반으로하는 데이터를 시뮬레이션하는 데 주로 사용됩니다. 그런 다음 실제 데이터의 진단을 시뮬레이션 된 데이터 세트의 진단과 비교합니다. vis.test
R 용 TeachingDemos 패키지 의 기능은 논문에서 제안 된 1 가지 변형을 구현합니다. 더 나은 이해를 위해 전체 논문 (단순한 요약이 아니라)을 읽으십시오.