시간이 지남에 따라 점점 더 자세한 예측 변수를 얻은 곳에서 변수를 가장 잘 모델링하는 방법을 이해하려고합니다. 예를 들어, 채무 불이행 대출에 대한 복구율 모델링을 고려하십시오. 20 년의 데이터가있는 데이터 세트가 있다고 가정하고, 그 첫 15 년 동안 대출이 담보인지 여부 만 알지만 그 담보의 특성에 대해서는 전혀 알지 못합니다. 그러나 지난 5 년 동안 우리는 담보물을 회복률을 잘 예측할 수있는 다양한 범주로 분류 할 수 있습니다.
이 설정을 통해 모형을 데이터에 맞추고 예측 변수의 통계적 유의성과 같은 측정 값을 결정한 다음 모형으로 예측하려고합니다.
어떤 누락 된 데이터 프레임 워크가 적합합니까? 더 자세한 설명 변수가 과거 샘플 전체에 흩어져있는 것이 아니라 주어진 시점 이후에만 사용 가능하다는 사실과 관련하여 특별히 고려해야 할 사항이 있습니까?