더 나은 내 질문을, 나는 16 변수 모델 (모두에서 출력의 일부를 제공 한 fit
)과 17 변수 모델 ( fit2
아래)을 (이러한 모델의 모든 예측 변수는이 모델 사이의 유일한 차이점은 그이고, 연속 fit
하지 않습니다 변수 17 (var17) 포함) :
fit Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13602.84 R2 0.173 C 0.703
0 69833 d.f. 17 g 1.150 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.160 gamma 0.416
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
fit2 Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13639.70 R2 0.174 C 0.703
0 69833 d.f. 18 g 1.154 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.170 gamma 0.412
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
Frank Harrell의 rms
패키지를 사용하여 이러한 lrm
모델을 작성했습니다. 보시다시피, 이러한 모델은 차별 지수 와 순위 차별 에서 크게 달라지지는 않습니다 . 색인 ; 그러나을 사용 lrtest(fit,fit2)
하여 다음과 같은 결과가 제공되었습니다.
L.R. Chisq d.f. P
3.685374e+01 1.000000e+00 1.273315e-09
따라서 우리는이 우도 비 검정의 귀무 가설을 기각 할 것입니다. 그러나 이러한 모델이 유사한 방식으로 수행되는 것처럼 보이기 때문에 샘플 크기 ( n = 102849)가 커서이 문제가 발생했다고 가정합니다 . 또한 n 이 클 때 중첩 이진 로지스틱 회귀 모델을 공식적으로 비교하는 더 좋은 방법을 찾고 싶습니다 .
이러한 유형의 중첩 모델을 비교할 때 올바른 방향으로 안내 할 수있는 피드백, R 스크립트 또는 설명서를 대단히 높이 평가합니다. 감사!
fit2
17 가변 모델이지만, 그것은 또한 생략합니다 그 모델입니다 V17
. 이것을 편집하고 싶을 수도 있습니다.
fit2
했습니다 fit
. 감사!