이 질문은 구체적으로 관련이 R
없지만 R
설명 하기 위해 사용 하기로 선택 했습니다.
(일반) qq- 라인에서 신뢰 대역을 생성하는 코드를 고려하십시오.
library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")
이 신뢰 대역이 어떻게 구성되어 있는지에 대한 설명 (또는 대안 문서 / 온라인 문서 링크)을 찾고 있습니다 (R의 도움말 파일에서 Fox 2002에 대한 참조를 보았지만 슬프게도 이것을 가지고 있지 않습니다 책 편리).
내 질문은 예를 들어 더 정확하게 만들어 질 것입니다. R
이 특정 CI를 계산 하는 방법 은 다음 과 같습니다 (에서 사용 된 코드를 단축 / 단순화했습니다 car::qqPlot
)
x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n) #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")
문제는 이러한 SE를 계산하는 데 사용 된 공식 (예 : line SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)
) 의 정당성이 무엇인가입니다 .
FWIW이 공식은 선형 회귀에 사용되는 일반적인 신뢰 대역 의 공식과 매우 다릅니다