로지스틱 회귀 분석에서 적합치에 대한 표준 오차는 어떻게 계산됩니까?


29

로지스틱 회귀 모형에서 적합치를 예측할 때 표준 오차는 어떻게 계산됩니까? I는 평균에 대한 피팅 값 (피셔 정보 행렬을 포함하는)이 아닌 계수들에 대한.

난 단지와 번호를 얻는 방법을 발견 R(예를 여기에 , 또는 R-도움에 여기 스택 오버플로),하지만 난 공식을 찾을 수 없습니다.

pred <- predict(y.glm, newdata= something, se.fit=TRUE)

온라인 소스를 제공 할 수 있다면 (바람직하게는 대학교 웹 사이트에서) 환상적입니다.

답변:


35

예측은 추정 된 계수의 선형 조합 일뿐입니다. 계수는 무정형 정규이므로 이러한 계수의 선형 조합도 무정형 정규입니다. 따라서 모수 추정값에 대한 공분산 행렬을 얻을 수 있으면 해당 추정값의 선형 조합에 대한 표준 오차를 쉽게 얻을 수 있습니다. 공분산 행렬을 로 나타내고 벡터에 내 선형 조합에 대한 계수를 C 로 쓰면 표준 오차는 √입니다.ΣCCΣ기음

# Making fake data and fitting the model and getting a prediction
set.seed(500)
dat <- data.frame(x = runif(20), y = rbinom(20, 1, .5))
o <- glm(y ~ x, data = dat)
pred <- predict(o, newdata = data.frame(x=1.5), se.fit = TRUE)

# To obtain a prediction for x=1.5 I'm really
# asking for yhat = b0 + 1.5*b1 so my
# C = c(1, 1.5)
# and vcov applied to the glm object gives me
# the covariance matrix for the estimates
C <- c(1, 1.5)
std.er <- sqrt(t(C) %*% vcov(o) %*% C)

> pred$se.fit
[1] 0.4246289
> std.er
          [,1]
[1,] 0.4246289

우리가 보여주는 '수동'방법은 다음을 통해보고 된 것과 동일한 표준 오류를 나타냅니다. predict


2
하나의 관련 질문이 있습니다. 로지스틱이 아닌 선형 회귀에서 값과 신뢰 구간을 예측할 때 오차 분산 / 표준 오차를 통합합니다. 그러나 로지스틱 회귀는 그렇지 않습니다. 이 차이는 로지스틱 회귀의 관측 값이 0 또는 1이고 오차 분산 추정에 아무런 의미가 없다는 사실에서 비롯된 것입니까? 적어도 무언가를해야한다고 느끼지만, 뭔가 빠졌을 수도 있습니다.
user2457873

3
오래된 질문이지만이 스레드가 지금 당장 나에게 도움이되었습니다.로 짓은 0 또는 1을 관찰하지만 확률을 예측합니다. 적합치의 표준 오차를 구하면 선형 예측 변수의 척도에 있습니다. 당신은 logit (fit +/- 1.96 * se.fit)를 말함으로써 확률에 대한 신뢰 구간을 얻습니다
generic_user

이것은 점근 법 정규 근사법을 사용한다는 점에 유의하십시오. 이는 로지스틱 모델에는 매우 나쁠 수 있습니다 (Hauss-Donner 현상에 대해서는이 사이트를 검색하십시오). 계수의 경우, 예를 들어 가능성 프로파일 링 (MASS의 confint 함수에 의해 사용됨)으로 해결할 수 있습니다. 선형 예측 변수로는 불가능합니다.
kjetil b halvorsen

2
OP가 요청한 내용에 대해서는 올바르지 않습니다. 적합한 GLM은 로짓 링크 기능이 아닌 ID 링크 기능을 사용합니다. 당신은 o <- glm(y ~ x, data = dat, family = binomial)대신 적합해야 합니다. 제발 수정 해 주시겠습니까? 귀하의 설명합니다 (사용하여 로그 확률 SE 추정 작동 type = "link"옵션)가 아니라 SE 때 predict용도 type = "response"옵션을 선택합니다.
Zhe Zhang
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.