로지스틱 회귀 모형 평가


13

나는 물류 모델을 연구하고 있으며 결과를 평가하는 데 어려움을 겪고 있습니다. 내 모델은 이항 로짓입니다. 내 설명 변수는 15 레벨의 범주 변수, 이분법 변수 및 2 개의 연속 변수입니다. 내 N은 8000보다 큽니다.

투자하려는 기업의 결정을 모형화하려고합니다. 종속 변수는 투자 (예 / 아니오)이며 15 단계 변수는 관리자가보고 한 투자에 다른 장애물입니다. 나머지 변수는 판매, 여신 및 사용 된 용량에 대한 통제입니다.

아래는 rmsR 의 패키지를 사용한 결과 입니다.

  Model Likelihood     Discrimination    Rank Discrim.    
                         Ratio Test            Indexes          Indexes       
Obs          8035    LR chi2     399.83    R2       0.067    C       0.632    
 1           5306    d.f.            17    g        0.544    Dxy     0.264    
 2           2729    Pr(> chi2) <0.0001    gr       1.723    gamma   0.266    
max |deriv| 6e-09                          gp       0.119    tau-a   0.118    
                                           Brier    0.213                     

          Coef    S.E.   Wald Z Pr(>|Z|)
Intercept -0.9501 0.1141 -8.33  <0.0001 
x1=10     -0.4929 0.1000 -4.93  <0.0001 
x1=11     -0.5735 0.1057 -5.43  <0.0001 
x1=12     -0.0748 0.0806 -0.93  0.3536  
x1=13     -0.3894 0.1318 -2.96  0.0031  
x1=14     -0.2788 0.0953 -2.92  0.0035  
x1=15     -0.7672 0.2302 -3.33  0.0009  
x1=2      -0.5360 0.2668 -2.01  0.0446  
x1=3      -0.3258 0.1548 -2.10  0.0353  
x1=4      -0.4092 0.1319 -3.10  0.0019  
x1=5      -0.5152 0.2304 -2.24  0.0254  
x1=6      -0.2897 0.1538 -1.88  0.0596  
x1=7      -0.6216 0.1768 -3.52  0.0004  
x1=8      -0.5861 0.1202 -4.88  <0.0001 
x1=9      -0.5522 0.1078 -5.13  <0.0001 
d2         0.0000 0.0000 -0.64  0.5206  
f1        -0.0088 0.0011 -8.19  <0.0001 
k8         0.7348 0.0499 14.74  <0.0001 

기본적으로 나는 회귀 분석을 a) 모델이 데이터에 얼마나 잘 적합시키는 지와 b) 모델이 결과를 얼마나 잘 예측하는지에 대해 평가하고자한다. 적합도 (a)를 평가하기 위해 고유 공변량의 수가 N에 가까우므로 카이 제곱을 기반으로 한 이탈도 검정이 적합하지 않다고 생각하므로 X2 분포를 가정 할 수 없습니다. 이 해석이 맞습니까?

epiR패키지를 사용하여 공변량을 볼 수 있습니다 .

require(epiR)
logit.cp <- epi.cp(logit.df[-1]))

    id n x1   d2 f1 k8
     1 1 13 2030 56  1
     2 1 14  445 51  0
     3 1 12 1359 51  1
     4 1  1 1163 39  0
     5 1  7  547 62  0
     6 1  5 3721 62  1
    ...
    7446

또한 Hosmer-Lemeshow GoF 테스트는 테스트를 실행하기 위해 데이터를 10으로 나눕니다. 이는 다소 임의적입니다.

대신 rms패키지로 구현 된 le Cessie–van Houwelingen–Copas–Hosmer 테스트를 사용 합니다. 이 테스트가 정확히 어떻게 수행되는지 잘 모르겠습니다. 아직이 논문을 읽지 않았습니다. 어쨌든 결과는 다음과 같습니다.

Sum of squared errors    Expected value|H0           SD             Z            P
         1711.6449914         1712.2031888    0.5670868    -0.9843245    0.3249560

P가 크므로 내 모델이 적합하지 않다는 증거가 충분하지 않습니다. 큰! 하나....

모형 (b)의 예측 용량을 확인할 때 ROC 곡선을 그리고 AUC가임을 알 수 0.6320586있습니다. 그다지 좋지 않습니다.

여기에 이미지 설명을 입력하십시오

그래서 내 질문을 요약하면 다음과 같습니다.

  1. 모델을 확인하기 위해 실행 한 테스트가 적절합니까? 다른 어떤 테스트를 고려할 수 있습니까?

  2. 모델이 전혀 유용하지 않습니까, 아니면 상대적으로 열악한 ROC 분석 결과에 따라 모델을 닫으시겠습니까?


당신은 확실히 당신의 것이 있습니까 x1하나의 범주 형 변수로 간주해야 하는가? 즉, 모든 경우에 투자에 1, 1 개의 '장애물'이 있어야합니까? 나는 어떤 경우에는 두 가지 이상의 장애물에 직면 할 수 있다고 생각할 것이고, 어떤 경우에는 아무것도 없습니다.
gung-복직 모니카

답변:


6

로지스틱 회귀 모델을 검사하기 위해 적용 할 수있는 수천 가지 테스트가 있으며,이 중 많은 것이 목표가 예측, 분류, 변수 선택, 추론, 인과 관계 모델링인지에 따라 달라집니다. 예를 들어 Hosmer-Lemeshow 테스트는 평가합니다. 모델 교정 ​​및 예측 값이 위험 십분 포로 분할 될 때 예측 주파수와 일치하는 경향이 있는지 여부. 10의 선택은 임의적이지만 테스트는 점근 적 결과를 가지며 쉽게 수정할 수 있습니다. HL 테스트와 AUC는 로지스틱 회귀 모델을 추정하는 데 사용 된 것과 동일한 데이터로 계산할 때 매우 흥미로운 결과를 얻었습니다. SAS 및 SPSS와 같은 프로그램이 사실상 다른 분석에 대한 통계를 자주보고 한 것은 놀라운 일입니다.로지스틱 회귀 결과를 나타내는 방법. 예측 정확도 (예 : HL 및 AUC) 테스트는 독립적 인 데이터 세트 또는 모델의 예측 능력을 평가하기 위해 여러 기간에 걸쳐 수집 된 (더 나은) 데이터를 사용하는 것이 좋습니다.

또 다른 요점은 예측과 추론이 매우 다르다는 것입니다. 예측을 평가하는 객관적인 방법은 없습니다. AUC 0.65는 1 년 유방암 위험과 같은 매우 드물고 복잡한 사건을 예측하는 데 매우 좋습니다. 마찬가지로, 전통적인 오 탐지율 0.05가 일반적으로 발생하기 때문에 추론은 임의적 인 것으로 비난받을 수 있습니다.

내가 당신이라면, 당신의 문제 설명은 투자에 대한 "장애"라고보고 된 관리자의 효과를 모델링하는 데 관심이있는 것처럼 보였으므로 모델 조정 협회를 제시하는 데 집중하십시오. 모형 승산 비에 대한 점 추정치 및 95 % 신뢰 구간을 제시하고 다른 사람과의 의미, 해석 및 타당성을 논의 할 준비를합니다. 포레스트 플롯은 효과적인 그래픽 도구입니다. 데이터에 이러한 장애물의 빈도를 표시하고 조정되지 않은 결과에서 혼란 가능성이 작은 지 또는 큰지를 입증하기 위해 다른 조정 변수에 의한 조정을 제시해야합니다. 더 나아가서 관리자들 사이에서 일관성을 유지하기 위해 Cronbach의 알파와 같은 요소를 조사하여 관리자가 비슷한 문제를보고하는 경향이 있는지 확인하기 위해 장애물을보고하거나,

나는 당신이 숫자에 너무 집중되어 있고 당면한 질문이 아니라고 생각합니다. 좋은 통계 자료의 90 %는 모델 결과가 제시되기 전에 진행됩니다.


답변 해 주셔서 감사합니다. 나는 대부분의 분석을 승산 비 해석 및 예측 확률에 기반합니다. 그러나 IM이 아직 로지스틱 회귀 분석과 함께 불편하지 않기 때문에 일반적인 모델 맞춤 테스트가 누락되어 분석이 취소 될 수 있습니다. 그러나 당신이 말했듯이, 나는 또한 모델의 실질적인 해석에 초점을 맞추어야한다고 믿습니다. 나는 숲의 음모와 크론 바흐의 알파에 대한 당신의 추천을 고려할 것입니다. 다시 감사합니다!
Federico C

모델 설명에 대한 합법적 인 잠재적 위반은 문제 설명이있을 때 상관 된 데이터 일 것입니다. 이를 염두에두고, 준 바이 노미 회귀 모델을 사용하여 분산 테스트를 수행 하거나 산업 유형별로 ( 하루 언급 한 다양한 회사에 대해) 하위 그룹 분석을 시도하거나 클러스터 분석을 다시 시도 할 수 있습니다.
AdamO
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.