Hosmer-Lemeshow 적합도의 로지스틱 회귀 및 해석 평가


24

우리 모두 알고 있듯이 로지스틱 회귀 모델을 평가하는 두 가지 방법이 있으며 매우 다른 것들을 테스트하고 있습니다.

  1. 예측력 :

    독립 변수를 기반으로 종속 변수를 얼마나 잘 예측할 수 있는지 측정하는 통계량을 얻으십시오. 잘 알려진 Pseudo R ^ 2는 McFadden (1974)과 Cox and Snell (1989)입니다.

  2. 적합도 통계

    이 테스트는 모델을 더 복잡하게하여 더 나은 작업을 수행 할 수 있는지 여부를 알려줍니다. 실제로 비선형 성이나 상호 작용이 있는지 테스트합니다.

    나는 모델에 두 가지 테스트를 구현했는데, 이차 및 상호 작용이
    이미 추가되었습니다 .

    >summary(spec_q2)
    
    Call:
    glm(formula = result ~ Top + Right + Left + Bottom + I(Top^2) + 
     I(Left^2) + I(Bottom^2) + Top:Right + Top:Bottom + Right:Left, 
     family = binomial())
    
     Coefficients:
                 Estimate Std. Error z value Pr(>|z|)    
    (Intercept)  0.955431   8.838584   0.108   0.9139    
    Top          0.311891   0.189793   1.643   0.1003    
    Right       -1.015460   0.502736  -2.020   0.0434 *  
    Left        -0.962143   0.431534  -2.230   0.0258 *  
    Bottom       0.198631   0.157242   1.263   0.2065    
    I(Top^2)    -0.003213   0.002114  -1.520   0.1285    
    I(Left^2)   -0.054258   0.008768  -6.188 6.09e-10 ***
    I(Bottom^2)  0.003725   0.001782   2.091   0.0366 *  
    Top:Right    0.012290   0.007540   1.630   0.1031    
    Top:Bottom   0.004536   0.002880   1.575   0.1153    
    Right:Left  -0.044283   0.015983  -2.771   0.0056 ** 
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1
    (Dispersion parameter for binomial family taken to be 1)
    Null deviance: 3350.3  on 2799  degrees of freedom
    Residual deviance: 1984.6  on 2789  degrees of freedom
    AIC: 2006.6
    

그리고 예측 된 검정력은 다음과 같고 MaFadden은 0.4004이며, 0.2 ~ 0.4 사이의 값은 모형에 매우 적합하게 제시되어야합니다 (Louviere et al (2000), Domenich and McFadden (1975)).

 > PseudoR2(spec_q2)
    McFadden     Adj.McFadden        Cox.Snell       Nagelkerke McKelvey.Zavoina           Effron            Count        Adj.Count 
   0.4076315        0.4004680        0.3859918        0.5531859        0.6144487        0.4616466        0.8489286        0.4712500 
         AIC    Corrected.AIC 
2006.6179010     2006.7125925 

적합도 통계 :

 > hoslem.test(result,phat,g=8)

     Hosmer and Lemeshow goodness of fit (GOF) test

  data:  result, phat
  X-squared = 2800, df = 6, p-value < 2.2e-16

내가 이해하는 것처럼 GOF는 실제로 다음과 같은 귀무 가설과 대립 가설을 테스트하고 있습니다.

  H0: The models does not need interaction and non-linearity
  H1: The models needs interaction and non-linearity

내 모델이 상호 작용을 추가했기 때문에 이미 비선형 성이 있고 p- 값은 H0을 기각해야 함을 보여 주므로 모델에 상호 작용, 비선형 성이 실제로 필요하다는 결론에 도달했습니다. 내 해석이 정확하고 미리 조언 해 주셔서 감사합니다.



2
HL 테스트의 p- 값보다 기본 테이블을 보는 것이 좋습니다. 또한 모델의 잔차 그림에서 볼 수 있습니다. 문제가있는 위치를 보여줍니다.
probabilityislogic

답변:


26

해결해야 할 몇 가지 문제가 있습니다.

  • 아르 자형2아르 자형2아르 자형2
  • Hosmer-Lemeshow 테스트는 2 차 효과와 같은 특정 맞춤 부족이 아닌 전체 교정 오류에 대한 것입니다. 그것은 과적 합을 제대로 고려하지 않고, 빈을 선택하고 Quantile을 계산하는 방법에 임의적이며, 종종 너무 낮은 전력을 갖습니다.
  • 이러한 이유로 Hosmer-Lemeshow 테스트는 더 이상 권장되지 않습니다. Hosmer 등은 R rms패키지 residuals.lrm기능으로 구현 된 더 나은 df 옴니버스 테스트를 제공 합니다.
  • 귀하의 경우 적합도는 모든 제곱 및 교호 작용 항의 기여도를 공동 테스트 ( "청크"테스트)하여 평가할 수 있습니다.
  • 그러나 모델을 지정하여 (특히 회귀 스플라인을 사용하여 선형성 가정 완화와 관련하여)보다 적합 할 가능성을 높이고 부트 스트랩을 사용하여 과적 합을 추정하고 과적 합 보정 된 고분해능 부드러운 보정 곡선을 사용하여 절대 값을 확인하는 것이 좋습니다. 정확성. 이들은 R rms패키지를 사용하여 수행 됩니다.

마지막으로, 나는 모델이 유연하고 (샘플 크기에 의해 제한됨에 따라)“맞춤 부족”보다“적합”에 더 집중한다는 철학을 선호합니다.


2
아르 자형2

1아르 자형2

4

에서 위키 백과 :

이 테스트는 관찰 된 이벤트 비율이 모델 모집단의 하위 그룹에서 예상되는 이벤트 비율과 일치하는지 여부를 평가합니다. Hosmer–Lemeshow 테스트는 구체적으로 하위 그룹을 적합 위험 값의 십진수로 식별합니다. 부분 군에서 예상 및 관찰 된 이벤트 비율이 유사한 모델을 잘 교정이라고합니다.

의미 : 모델의 y 모델 점수를 매긴 모델을 구축 한 후 실제 이벤트 속도와 비슷한 10 개의 십분 위에 분포되어 있는지 교차 확인하고 싶습니다.

따라서 가설은

  • H0
  • H1

따라서 p- 값이 .05보다 작 으면 분포가 잘되지 않아 모형을 수정해야합니다.

이 질문에 대한 답변이 되었기를 바랍니다.


3

이것은 @FrankHarrell의 대답에 따라 다소 번거롭지 만 H-L 테스트의 팬은 2 차 항과 일부 2 차 상호 작용이 포함 되어 있음에도 불구하고 모델에 여전히 상당한 적합 결여가 있음을 보여줍니다. 더 복잡한 모델이 적합합니다. 더 간단한 1 차 모델이 아니라 지정한 모델의 적합성을 테스트하고 있습니다.

†이 모델은 완전한 2 차 모델이 아닙니다. 세 가지 상호 작용이 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.