콕스 비례 위험 모델 및 무작위로 선정되지 않은 샘플


9

무작위로 선정되지 않은 표본 (Heckman의 교정과 같은 것)으로 인한 Cox 비례 위험 모델의 편향을 교정하는 방법이 있습니까?

배경 :
상황이 다음과 같다고 가정 해 봅시다
.-처음 2 년 동안 모든 고객이 수락됩니다.
-2 년 후 Cox PH 모델이 구축되었습니다. 모델은 고객이 서비스를 얼마나 오래 사용할지 예측합니다.
-회사의 정책으로 인해 3 개월 이상 생존 할 확률이 0.5보다 큰 고객 만 허용되며 나머지는 거부됩니다.
-2 년 후 새로운 모델을 만들어야합니다. 문제는 승인 된 고객만을 대상으로하며이 고객 만 사용하면 심각한 편견이 생길 수 있다는 것입니다.


1
이 분석의 요점은 무엇입니까? Cox PH 모델은 일부 스무딩 방법이나 파라 메트릭 모델링을 통합하지 않는 한 실패 시간을 명시 적으로 예측하지 않습니다. 이 모델에는 어떤 계층화 / 조정 변수가 있습니까?
AdamO

답변:


4

semi-parametric Cox Model을 사용한 파라 메트릭 접근 방식의 문제점은이 특정 문제가 실제로 누락 된 데이터와 관련되어 있다는 것입니다. 저자가 모델 파라미터 (및 기준 위험 함수의 추정치), 데이터의 두 번째 단계에서의 포함 확률을 기반으로 한 위험 예측이 있다고 가정 할 때 Cox 모델에서 절대 위험 예측을 얻는 방법을 설명하지 않았음에도 불구하고 수집은 원래 위험 예측에 의존하므로 누락은 관측 된 변수, 즉 임의 데이터에서 누락 된 것에 따라 달라집니다.
AdamO

2

간단한 대답은 가중치입니다. 즉, 가중치를 사용하여 "허용 된"그룹의 그룹을 관심있는 인구로 표준화 할 수 있습니다. 첫 번째와 두 번째 2 년 단계를 모두 사용하는 풀링 분석에서 이러한 가중치를 사용하여 발생하는 문제는 추정 된 인구 가중치와 매개 변수가 이제 종속적이라는 것입니다. pseudolikelihood 접근법은 일반적으로 샘플 가중치와 모수 추정값 간의 종속성을 무시하는 경우에 사용됩니다 (이 경우 일종의 pseudo-partial likelihood). 그러나 많은 실제 상황에서 (그리고 이것도 다르지 않다),이 의존성을 설명 할 필요가있다. 위험 비율의 효율적인 견적을 작성하는 문제는 어려운 것이며, 내가 아는 한 개방형입니다.

2 상 층화 된 샘플로부터 모델 파라미터의 개선 된 Horvitz-Thompson 추정 : 역학에서의 응용 .

이 기사에서는 일반적으로 로지스틱 회귀에 적용되는 측량 방법에 대해 설명하지만 생존 데이터에 가중치를 부여 할 수도 있습니다. 언급하지 않은 몇 가지 중요한 고려 사항은 전체 모집단 또는 2 년 추정치에 따른 "자격"모집단 또는 결과에 따른 "자격"모집단에 적용되는 예측을 작성하는 데 관심이 있는지 여부입니다. 모델. Cox 모델의 적합치가 위험으로 해석 될 수 없기 때문에 이러한 "예측"모델이 Cox 모델에서 어떻게 생성되는지 정확하게 언급하지 않았습니다. 위험 비율을 추정 한 다음 기준 위험 함수의 평활 추정치를 구합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.