하나의 데이터 세트 (모델 구축 데이터 세트)에서 특정 질병의 발생에 대한 예측 모델을 구성했으며 이제 새 데이터 세트 (유효성 검증 데이터 세트)에서 모델이 얼마나 잘 작동하는지 확인하려고합니다. 로지스틱 회귀로 작성된 모델의 경우 모델 빌딩 데이터 세트에서 얻은 모델 계수를 기반으로 유효성 검사 데이터 세트의 각 사람에 대한 예측 확률을 계산 한 다음 일부 컷오프 값에서 확률을 이분법 화 한 후 2x2 테이블을 구성 할 수 있습니다 이를 통해 실제 양의 비율 (민감도)과 실제 음의 비율 (특성)을 계산할 수 있습니다. 또한 컷오프를 변경하여 전체 ROC 곡선을 구성한 다음 ROC 그래프의 AUC를 얻을 수 있습니다.
이제 실제로 생존 데이터가 있다고 가정합니다. 따라서 모델 구축 데이터 집합에 Cox 비례 위험 모델을 사용했으며 이제 유효성 검사 데이터 집합에서 모델이 얼마나 잘 작동하는지 확인하고 싶습니다. Cox 모델에서는 기준선 위험이 파라 메트릭 함수가 아니기 때문에 모델 구축 데이터 집합에서 얻은 모델 계수를 기반으로 유효성 검사 데이터 집합에서 각 사람의 예상 생존 확률을 얻는 방법을 알 수 없습니다. 그렇다면 유효성 검사 데이터 세트에서 모델이 얼마나 잘 작동하는지 확인하려면 어떻게해야합니까? 이를위한 확립 된 방법이 있습니까? 그렇다면 어떤 소프트웨어로 구현 되었습니까? 어떤 제안이라도 미리 감사드립니다!