Cox 모델 와 같은 통계의 주요 문제아르 자형2(다른 답변에서 설명)은 데이터의 검열 분포에 매우 의존적입니다. 널 모델에 대한 우도 비율과 같은 다른 자연적인 것들에도이 문제가 있습니다. (기본적으로 검열 된 데이터 포인트의 가능성에 대한 기여는 이벤트가 관찰되는 데이터 포인트의 기여와 매우 다르기 때문입니다. 하나는 PDF에서, 하나는 CDF에서 온 것이기 때문입니다.) 이 문제를 해결할 방법을 제안했지만 필자가 보았던 방법은 일반적으로 검열 분포 모델이나 비현실적인 것을 요구합니다. 이 의존성이 실제로 얼마나 나쁜지 조사하지 않았으므로 검열이 상당히 온화한 경우에도 가능성 비율 기반 통계를 볼 수 있습니다. 생존 CART 모델의 경우
일반적인 생존 모델의 경우 자주 사용되는 통계 중 하나는 Harrell의 c 지수, Kendall의 또는 ROC AUC와 유사 합니다. 기본적으로 c 는 한 인스턴스가 다른 인스턴스보다 늦게 이벤트를 겪었다는 것을 알고 있는 모든 인스턴스 중에서 모델의 순위가 올바른 비율입니다. 다시 말해, 여기에서 한 쌍의 인스턴스가 분모에 포함 되려면 최대 한 개가 검열 될 수 있고 다른 한 개가 이벤트를 경험 한 후에 는 검열되어야합니다 . c 색인은 검열 분포에 따라 다릅니다. Harrell에 따르면 의존성은 위에서 언급 한 다른 통계보다 더 온화합니다. 불행히도, Harrell 's cτ또한 위의 통계보다 덜 민감하므로 모델 간의 차이가 작은 경우 모델을 기반으로 모델을 선택하지 않을 수 있습니다. 다른 모델을 비교하는 방법보다 해석 가능한 일반 성능 지수로 더 유용합니다.
(마지막으로, 모델에 대한 특정 목적을 염두에두고 있다면, 즉 예측 손실 함수가 무엇인지 알고 있다면 항상 손실 함수에 따라 모델을 평가할 수 있습니다! 운이 좋지 않아 ...)
우도 비 통계와 Harrell 's c에 대한 자세한 내용은 Harrell의 훌륭한 교과서 인 Regression Modeling Strategies를 참조하십시오 . 생존 모델 평가 섹션은 §19.10, pp. 492-493입니다. 하나의 결정적인 답변을 드릴 수 없어서 죄송하지만 이것이 해결 된 문제라고 생각하지 않습니다!