나는 Cox 비례 위험 회귀 및 일부 Kaplan-Meier 모델과 같은 전통적인 통계 모델을 사용하여 다음 사건이 발생할 때까지의 일을 실패 등으로 예측할 수 있습니다. 즉 생존 분석
질문
- GBM, 신경망 등과 같은 기계 학습 모델의 회귀 버전을 사용하여 이벤트가 발생할 때까지 일을 어떻게 예측할 수 있습니까?
- 대상 변수로 발생까지 일을 사용하고 회귀 모델을 실행하는 것만으로는 작동하지 않는다고 생각합니까? 왜 작동하지 않으며 어떻게 해결할 수 있습니까?
- 생존 분석 문제를 분류로 변환 한 다음 생존 확률을 얻을 수 있습니까? 그렇다면 이진 대상 변수를 만드는 방법은 무엇입니까?
- 기계 학습 접근법 대 콕스 비례 위험 회귀 및 Kaplan-Meier 모델 등의 장단점은 무엇입니까?
샘플 입력 데이터가 아래 형식이라고 상상해보십시오
노트 :
- 센서는 10 분 간격으로 데이터를 핑하지만 NA가있는 행으로 표시되는 네트워크 문제 등으로 인해 데이터가 누락 될 수 있습니다.
- var1, var2, var3은 예측 변수, 설명 변수입니다.
- failure_flag는 시스템 고장 여부를 알려줍니다.
- 각 머신 ID마다 10 분 간격으로 지난 6 개월의 데이터가 있습니다.
편집하다:
참고 : 매일 30 일 동안 다음 30 일 동안 각 기계의 고장 확률을 예측하고 싶습니다.
failure_flag
.