로지스틱 회귀 분석의 Pearson VS 편차 잔차


16

표준화 된 Pearson 잔차는 전통적인 확률 론적 방식으로 얻어진다는 것을 알고 있습니다.

ri=yiπiπi(1πi)

이탈 잔차는보다 통계적인 방법 (각 지점의 가능성에 대한 기여도)을 통해 얻습니다.

di=si2[yilogπi^+(1yi)log(1πi)]

여기서, 경우 (1) = Y = 1과 s의 = -1 경우 Y = 0.siyisiyi

이탈 잔차에 대한 공식을 해석하는 방법을 직관적으로 설명해 주시겠습니까?

또한 하나를 선택하려면 어느 것이 더 적합하고 왜 선택해야합니까?

BTW, 일부 참고 문헌은 용어에 따라 이탈 잔차를 도출한다고 주장합니다.

12ri2

ri


모든 생각을
Jack Shi

1
"일부 참조"라고 말할 때 ... 어떤 참조가 어떻게됩니까?
Glen_b-복지 주 모니카

답변:


10

로지스틱 회귀 분석은 로그 우도 함수를 최대화하려고합니다.

LL=kln(Pi)+rln(1Pi)

PiY^=1kY=1rY=0

그 표현은

LL=(kdi2+rdi2)/2

사례의 이탈 잔차 는 다음과 같이 정의되기 때문입니다.

di={2ln(Pi)if Yi=12ln(1Pi)if Yi=0

따라서 이항 로지스틱 회귀 분석은 제곱 이탈 잔차의 합을 최소화하기 위해 직접 찾습니다. 회귀의 ML 알고리즘에 내재 된 이탈 잔차입니다.

2(LLfull modelLLreduced model)


2

질문에 대한 답변으로 som R 코드를 추가하여 이탈 잔차 계산을 위해 공식을 수동으로 적용하는 방법을 보여줍니다.

코드의 모델은 로짓 모델입니다.

pi:=Pr(Yi=1)=exp(b0+b1xi)1+exp(b0+b1xi).

vi:=b0+b1xi

pi:=Pr(Yi=1)=exp(vi)1+exp(vi).

b^0b^1

v^i:=b^0+b^1xi,

계산 된 다음 예상 확률이 계산됩니다.

p^i=exp(v^i)1+exp(v^i).

이러한 예측 확률을 사용하여 편차 잔차에 대한 공식이 코딩 단계에 적용됩니다.

sign(y-pred_p) * ifelse(y==1,sqrt(-2*log(pred_p)),sqrt(-2*log(1-pred_p)))

이것은 단순히 공식의 적용입니다

di={2ln(p^i)if Yi=12ln(1p^i)if Yi=0

# Simulate some data
N <- 1000
b0 <- 0.5
b1 <- 1
x <- rnorm(N)
v <- b0 + b1*x
p <- exp(v)/(1+exp(v))
y <- as.numeric(runif(N)<p)

# Estimate model
model <- glm(y~x,family=binomial)
summary_model <- summary(model)
summary_dev_res <- summary_model$deviance.resid
# This is the output you get:
quantile(summary_dev_res)


# Calculate manually deviance residuals
# First calculate predicted v's
pred_v <- coef(model)[1] + coef(model)[2]*x
# The calculate predicted probabilities
pred_p <- exp(pred_v)/(1+exp(pred_v))
# Apply formula for deviance residuals
dev_res <- sign(y-pred_p) * ifelse(y==1,sqrt(-2*log(pred_p)),sqrt(-2*log(1-pred_p)))
# Check that it is the same as deviance residuals returned from summary
plot(summary_dev_res,dev_res)
points(seq(-3,3,length.out=100),seq(-3,3,length.out=100),type="l",col="red",lwd=2)
# all points should be on the red line 


# Also compare the quantiles ... 
quantile(summary_dev_res)
quantile(dev_res)
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.