생존 분석에서 왜 완전 파라 메트릭 모델 대신 세미 파라 메트릭 모델 (Cox 비례 위험)을 사용합니까?


24

나는 콕스 비례 위험 모델을 연구 해 왔으며,이 질문은 대부분의 텍스트에서 빛을 발합니다.

콕스는 부분적 우도 법을 사용하여 위험 함수의 계수를 피팅하는 것을 제안했지만 최대 우도 법과 선형 모형을 사용하여 파라 메트릭 생존 함수의 계수를 왜 적합하지 않습니까?

데이터를 검열 한 경우 곡선 아래 영역 만 찾을 수 있습니다. 예를 들어, 표준 편차가 80 인 추정치가 380이고 표본이> 300 인 경우, 정규 오차를 가정하여 우도 계산에서 해당 표본에 대해 84 % 확률이 있습니다.


여기에서 보험계 리학 관련 질문을하고 싶은 한,이 질문이 아마도 통계 사이트 인 Cross Validated에서 더 나은 응답을 얻을 것이라고 말해야합니다. 중재자에게 마이그레이션을 요청할 수 있습니다.
Graphth

자, 그것이 존재한다는 것을 몰랐습니다. 마이그레이션을 요청하는 방법을 잘 모르겠습니다. 마이그레이션 하시겠습니까?

@Graphth, 나는 또한 하나가 있다는 것을 몰랐습니다 ... 나는 "모든 사이트"목록에서 그것을 찾지 못했습니다. 여기에 연결할 수 있습니까? 감사합니다

답변:


27

데이터가 따르는 파라 메트릭 분포를 알고 있다면 최대 우도 접근법을 사용하면 분포가 적합합니다. Cox 비례 위험 회귀 분석의 실제 장점은 분포를 알지 못하거나 가정하지 않고도 생존 모델에 여전히 적합하다는 것입니다. 정규 분포를 사용하여 예를 제시하지만 대부분의 생존 시간 (및 Cox PH 회귀가 사용되는 다른 유형의 데이터)은 정규 분포를 따르지 않습니다. 일부는 대수-정규, Weibull 또는 기타 모수 분포를 따를 수 있으며, 그러한 가정을 기꺼이 할 경우 최대 가능성 모수 접근 방식이 좋습니다. 그러나 많은 실제 상황에서 우리는 적절한 분포가 무엇인지 (또는 충분히 가까운 근사치) 알지 못합니다. 검열과 공변량을 사용하면 간단한 히스토그램을 수행 할 수 없으며 "저에게 분포 된 것처럼 보입니다"라고 말할 수 없습니다. 따라서 특정 배포판 없이도 잘 작동하는 기술을 사용하는 것이 매우 유용합니다.

분배 기능 대신 위험을 사용하는 이유는 무엇입니까? 다음과 같은 진술을 생각해보십시오. "그룹 A의 사람들은 그룹 B의 사람들보다 80 세에 사망 할 확률이 두 배입니다" 그룹 B의 사람들이 그룹 A의 사람들보다 더 오래 사는 경향이 있거나, 그룹 B의 사람들이 더 짧은 삶을 사는 경향이 있고 대부분의 사람들이 80 세 이전에 죽었 기 때문에 매우 사실 일 수 있습니다. 그룹 A의 충분한 사람들이 80 세에 살면서 그 나이에 상당수의 사람들이 죽어 그 나이에 사망 할 확률이 훨씬 높은 80 세의 나이로 80 세로 사망했습니다. 따라서 같은 진술은 그룹 A에있는 것이 그룹 B에있는 것보다 낫거나 나쁘다는 것을 의미 할 수 있습니다. 80 세까지 살았던 사람들 (각 그룹에 속한 사람들)이 81 세가되기 전에 사망 할 비율은 더 의미가 있습니다. 이것이 위험입니다 (그리고 위험은 분배 기능 / 생존 기능 등의 기능입니다). 위험은 반모 수 모델에서보다 쉽게 ​​작업 할 수 있으며 분포에 대한 정보를 제공 할 수 있습니다.


7
좋은 대답입니다. 시간의 독특한 점은 시간이 한 방향으로 지나간다는 것입니다. 위험이 높은 기간을 극복하면 현재 위험에 주로 관심이 있습니다. 그것이 위험 기능이 우리에게 알려주는 것입니다.
Frank Harrell

2
추가해야 할 또 다른 요점은 검열 데이터를 사용하여 분포 가정을 검사하는 것이 매우 어려울 수 있다는 것입니다. 예를 들어, 대상의 20 % 만 이벤트를 관찰한다고 가정하십시오. 분포의 꼬리가 Weibull 분포를 따르는 지 여부를 확인하려고 시도하는 것은 불가능합니다! Cox-PH 모델 은이 문제를 어느 정도 회피합니다 (그러나 매우 검열 된 시간 영역에 외삽하려는 경우 비례 위험 가정에 매우주의해야합니다)
Cliff AB

16

"우리"가 반드시 그런 것은 아닙니다. 생존 분석 도구의 범위는 Kaplan-Meier 방법과 같은 완전 비모수 적에서부터 기본 위험의 분포를 지정하는 완전 모수 적 모델까지 다양합니다. 각각의 장단점이 있습니다.

Cox 비례 위험 모델과 같은 반모 수 방법을 사용하면 기본 위험 기능을 지정하지 않아도됩니다. 우리는 항상 기본 위험 기능을 알지 못하고 많은 경우 신경 쓰지 않기 때문에 도움이 될 수 있습니다 . 예를 들어, 많은 역학 연구에서 "노출 X가 이벤트 Y까지의 시간을 줄입니까?" 그들이 관심을 갖는 것은 X가 있고 X가없는 환자의 차이입니다.이 경우 근본적인 위험은 실제로 중요하지 않으며 그것을 잘못 지정하는 위험은 그것을 알지 못하는 결과보다 더 나쁩니다.

그러나 이것이 사실이 아닌 경우도 있습니다. 근본적인 위험 에 관심 있었기 때문에 완전히 파라 메트릭 모델로 작업했습니다 .


1
"... 그리고 그것을 잘못 지정하는 위험은 그것을 알지 못하는 결과보다 더 나쁘다." 매우 도움이되었습니다. 감사합니다.

근본적인 위험이 언제 관심을 가질 지에 대한 예를 들어 주시겠습니까?
Dan Chaltiel

1
@DanChaltiel 수학적 모델 등으로 들어 가려는 모든 추정은 예를들 수 있습니다. 특히 중요한 위험 함수가 있습니다.
Fomite
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.