다음 코드를 사용하여 로지스틱 회귀를 만들었습니다.
full.model.f = lm(Ft_45 ~ ., LOG_D)
base.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg)
step(base.model.f, scope=list(upper=full.model.f, lower=~1),
direction="forward", trace=FALSE)
그런 다음 출력을 사용하여 최종 모델을 만들었습니다.
final.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg + IP_util_E2_m02_flg +
AE_NumVisit1_flg + OP_NumVisit1_m01_flg + IP_TotLoS_m02 +
Ft1_45 + IP_util_E1_m05_flg + IP_TotPrNonElecLoS_m02 +
IP_util_E2pl_m03_flg + LTC_coding + OP_NumVisit0105_m03_flg +
OP_NumVisit11pl_m03_flg + AE_ArrAmb_m02_flg)
그런 다음 예측 함수를 사용하여 다른 데이터 세트의 결과를 예측했습니다.
log.pred.f.v <- predict(final.model.f, newdata=LOG_V)
유쾌한 ROC 곡선을 설정하고 민감도와 특이도를 설정하여 예상되는 응답을 제공하는 테이블을 만들 수있었습니다.
그러나 내가하려고하는 것은 각 데이터 행에 대해 Ft_45의 확률이 1인지 확인하는 것입니다. log.pred.fv의 출력을 보면 예를 들어 다음과 같습니다.
1 -0.171739593
2 -0.049905948
3 0.141146419
4 0.11615669
5 0.07342591
6 0.093054334
7 0.957164383
8 0.098415639
.
.
.
104 0.196368229
105 1.045208447
106 1.05499112
나는 내가하고있는 일을 잠정적으로 파악하기 때문에 0과 1 사이의 확률을 기대할 때 1보다 큰 음수와 높은 값을 해석하는 방법을 이해하기 위해 고심하고 있습니다.
그래서 내 질문은 출력을 변환해야하거나 완전히 잘못 된 단계를 놓친 것입니다. 제공 할 수있는 도움에 대해 미리 감사드립니다.