GLM에 대한 의사 R 제곱 공식


답변:


22

GLiM 에는 많은 의사 가 있습니다. 우수한 UCLA 통계 도움말 사이트에는 여기에 대한 포괄적 인 개요가 있습니다 . 당신이 나열한 것을 McFadden 's pseudo- 합니다. UCLA의 유형에 비해 널 모델에 비해 적합 모델의 개선을 색인한다는 점에서 와 같습니다 . SPSS와 같은 일부 통계 소프트웨어는 올바르게 기억한다면 기본적으로 로지스틱 회귀 분석과 같은 일부 분석 결과와 함께 McFadden의 의사 를 인쇄 하므로 Cox & Snell과 Nagelkerke pseudo- 이지만 매우 일반적이라고 생각합니다. 초가 더 그렇습니다. 그러나 McFadden의 의사 에는 다음과 같은 속성이 모두 없습니다.아르 자형2아르 자형2아르 자형2아르 자형2아르 자형2아르 자형2아르 자형2 (의사 는 없음). 누군가 의사 를 사용하여 모형을 이해하는 데 관심 이있는 경우이 우수한 CV 스레드를 읽는 것이 좋습니다. 로지스틱 회귀 분석 (Cox & Snell 또는 Nagelkerke)에 대해 어떤 의사 측정치가보고됩니까? (그것의 가치, 무엇을 위해 자체가 사람들이 생각하는 것보다 slipperier입니다, 좋은 데모가있는 여기 @ whuber의 대답에서 볼 수있다 : IS ? 유용하거나 위험 ) 아르 자형2아르 자형2아르 자형2아르 자형2아르 자형2


이러한 의사 R2가 모두 로지스틱 회귀 전용으로 설계되었는지 궁금합니다. 아니면 포아송과 감마-글램에 대해서도 일반화합니까? I는 각각 서로 다른 가능한 GLM-R2 화학식 발견Colin Cameron, A., & Windmeijer, F. A. (1997). An R-squared measure of goodness of fit for some common nonlinear regression models. Journal of Econometrics, 77(2), 329-342.
옌스

@Jens, 그들 중 일부는 확실히 LR에 특정한 것 같지만 다른 것들은 GLiM에서 얻을 수있는 이탈을 사용합니다.
gung-모니 티 복원

1
McFadden의 는 종종 로그 우도 (log-likelihood)로 정의되는데, 이는 OP의 문제에서와 같이 편차가 아니라 가산 상수까지만 정의됩니다. 가산 상수를 지정하지 않으면 McFadden의 가 잘 정의되지 않습니다. 이탈은 첨가 상수의 유일한 선택입니다. 일반화가 선형 모델의 와 비교할 수 있다면 내 마음에 가장 적합한 선택 입니다. 아르 자형2아르 자형2아르 자형2
NRH

감안 GLMS는 같이 반복적 reweighted 최소 제곱 법을 이용하여 적합 것을 bwlewis.github.io/GLM GLM 다시 준다 (중량으로 1 / 분산 가중치를 이용하여 실제로 GLM 링크 눈금 가중 R2 산출 이의 어떨지, glm fit의 슬롯 무게)?
Tom Wenseleers

@TomWenseleers, 원하는대로 할 수 있지만 기본 인수는 "Which pseudo- ... to report ..."스레드, 특히 확률 론적 답변에 링크되어 있습니다. 아르 자형2
gung-Monica Monica 복원

9

R은 출력에 널 및 잔차 편차를 제공 glm하므로 이러한 종류의 비교를 정확하게 수행 할 수 있습니다 (아래의 마지막 두 줄 참조).

> x = log(1:10)

> y = 1:10

> glm(y ~ x, family = poisson)

>Call:  glm(formula = y ~ x, family = poisson)

Coefficients:
(Intercept)            x  
  5.564e-13    1.000e+00  

Degrees of Freedom: 9 Total (i.e. Null);  8 Residual
Null Deviance:      16.64 
Residual Deviance: 2.887e-15    AIC: 37.97

또한 함께 객체에서 이러한 값을 뽑을 수 model$null.deviancemodel$deviance


아, 알았어요 나는 단지 질문대로 쓰여졌다. 더 많이 추가했지만 null 이탈이 어떻게 계산되는지 100 % 확실하지 않습니다 (포화 모델의 로그 우도와 관련이 있지만 자신감에 대해 채도에 대한 세부 사항을 충분히 기억하지 못합니다. 좋은 직관을 줄 수있었습니다)
David J. Harris

나는 glm 출력 (가족 possion 또는 quasipoisson)에 없습니다.
Curious

@Tomas 내 편집 내용을 참조하십시오. 2 년 전에 착각했는지 또는 그 이후 기본 출력이 변경되었는지 알 수 없습니다.
David J. Harris

summary.glm아르 자형2

1
질문을 읽으십시오. 당신이 대답한다고 생각하십니까? 문제는 "공식의 구성 요소를 어디서 구할 수 있습니까?"는 아니 었습니다.
Curious

6

제안한 공식은 Maddala (1983) 및 Magee (1990)가 로지스틱 모형에서 R 제곱을 추정하기 위해 제안했습니다. 따라서 모든 glm 모델에 적용 할 수는 없다고 생각합니다 (266 페이지의 Thomas P. Ryan의 현대 회귀 분석법 책 참조).

가짜 데이터 세트를 만들면 가우스 glm에 대한 R 제곱이 과소 평가됨을 알 수 있습니다.

가우시안 glm의 경우 기본 (lm) R 제곱 공식을 사용할 수 있다고 생각합니다.

R2gauss<- function(y,model){
    moy<-mean(y)
    N<- length(y)
    p<-length(model$coefficients)-1
    SSres<- sum((y-predict(model))^2)
    SStot<-sum((y-moy)^2)
    R2<-1-(SSres/SStot)
    Rajust<-1-(((1-R2)*(N-1))/(N-p-1))
    return(data.frame(R2,Rajust,SSres,SStot))
}

그리고 물류 (또는 r의 이항 군)에 대해 제안한 공식을 사용합니다 ...

    R2logit<- function(y,model){
    R2<- 1-(model$deviance/model$null.deviance)
    return(R2)
    }

지금까지 포아송 glm의 경우이 게시물의 방정식을 사용했습니다.

https://stackoverflow.com/questions/23067475/how-do-i-obtain-pseudo-r2-measures-in-stata-when-using-glm-regression

연구 게이트에서 의사 R2에 대한 훌륭한 기사도 있습니다 ... 링크는 다음과 같습니다.

https://www.researchgate.net/publication/222802021_Pseudo_R-squared_measures_for_Poisson_regression_models_with_over-_or_underdispersion

도움이 되었기를 바랍니다.


family = gaussian (link = identity)으로 GLM 모델을 맞추고 값을 확인 1-summary(GLM)$deviance/summary(GLM)$null.deviance하면 R2가 일반 OLS 회귀의 R2 값과 일치한다는 것을 알 수 있으므로 위의 대답이 정확합니다! 내 게시물을 참조하십시오 -stats.stackexchange.com/questions/412580/…
Tom Wenseleers

3

R 패키지 는 David J. Harris가 언급 한대로 D- 제곱modEvA계산합니다.1 - (mod$deviance/mod$null.deviance)

set.seed(1)
data <- data.frame(y=rpois(n=10, lambda=exp(1 + 0.2 * x)), x=runif(n=10, min=0, max=1.5))

mod <- glm(y~x,data,family = poisson)

1- (mod$deviance/mod$null.deviance)
[1] 0.01133757
library(modEvA);modEvA::Dsquared(mod)
[1] 0.01133757

모델의 D- 제곱 또는 설명 편차는 (Guisan & Zimmermann 2000) https://doi.org/10.1016/S0304-3800(00)00354-9에 도입되었습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.