모형을 적합하게 만든 후에는 예측 결함을 변수로 사용하여 다른 표준 기술에 의미가있는 다른 기법을 비교해보십시오. 연속 변수라는 장점이 있으므로 작은 차이도 볼 수 있습니다. 예를 들어, 사람들은 둘 다 1로 반올림하더라도 1.4와 0.6의 예상 결함 수의 차이를 이해할 것입니다.
예측 된 값이 두 변수에 어떻게 의존하는지에 대한 예를 보려면 예측 된 결함을 표시하기 위해 두 축과 색상 및 윤곽으로 복잡성 v. 실제 데이터 포인트를 맨 위에 겹쳐 놓습니다.
아래 그림은 연마와 범례가 필요하지만 시작점이 될 수 있습니다.
대안은 기존 가우스 응답 회귀에서 더 친숙한 추가 변수 도표 또는 부분 회귀 도표입니다. 이들은 자동차 라이브러리에서 구현됩니다. 효과적으로 나머지 설명 변수가 응답 및 설명 변수 모두에 대한 기여를 제거한 후 응답의 남은 것과 설명 변수 중 하나의 남은 것 사이의 관계를 효과적으로 보여줍니다. 내 경험상 대부분의 비 통계적 청중들은 이것들을 이해하기가 어렵다는 것을 알게됩니다 (물론 내 설명이 좋지 않을 수도 있습니다).
#--------------------------------------------------------------------
# Simulate some data
n<-200
time <- rexp(n,.01)
complexity <- sample(1:5, n, prob=c(.1,.25,.35,.2,.1), replace=TRUE)
trueMod <- exp(-1 + time*.005 + complexity*.1 + complexity^2*.05)
defects <- rpois(n, trueMod)
cbind(trueMod, defects)
#----------------------------------------------------------------------
# Fit model
model <- glm(defects~time + poly(complexity,2), family=poisson)
# all sorts of diagnostic checks should be done here - not shown
#---------------------------------------------------------------------
# Two variables at once in a contour plot
# create grid
gridded <- data.frame(
time=seq(from=0, to=max(time)*1.1, length.out=100),
complexity=seq(from=0, to=max(complexity)*1.1, length.out=100))
# create predicted values (on the original scale)
yhat <- predict(model, newdata=expand.grid(gridded), type="response")
# draw plot
image(gridded$time, gridded$complexity, matrix(yhat,nrow=100, byrow=FALSE),
xlab="Time", ylab="Complexity", main="Predicted average number of defects shown as colour and contours\n(actual data shown as circles)")
contour(gridded$time, gridded$complexity, matrix(yhat,nrow=100, byrow=FALSE), add=TRUE, levels=c(1,2,4,8,15,20,30,40,50,60,70,80,100))
# Add the original data
symbols(time, complexity, circles=sqrt(defects), add=T, inches=.5)
#--------------------------------------------------------------------
# added variable plots
library(car)
avPlots(model, layout=c(1,3))