콕스 위험 모델 생존 곡선을 어떻게 해석합니까?


9

콕스 비례 위험 모델의 생존 곡선을 어떻게 해석합니까?

이 장난감 예 age에서 kidney데이터의 변수에 대한 cox 비례 위험 모델이 있고 생존 곡선을 생성 한다고 가정 합니다.

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

여기에 이미지 설명을 입력하십시오

예를 들어, 시간 에 어떤 진술이 참입니까? 또는 둘 다 잘못 되었습니까?200

  • 진술 1 : 우리는 20 %의 피험자를 남길 것입니다 (예 : 명, 일까지 약 남음). 1000200200

  • 성명서 2 : 한 사람에게 일에 확률로 생존 할 수 있습니다.20%200


내 시도 : 나는 iid 가정이 없기 때문에 두 진술이 동일하다고 생각하지 않는다. 그것은 내 질문에 로지스틱 회귀 분석과 유사 여기에 각 사람의 위험 속도에 따라 달라집니다, 그 사람을 위해.β엑스


모델은 이벤트 시간 사이에 독립성을 가정합니다.
ocram

생존 분석은 독립 가정을 가질 수 있습니다
Aksakal

따라서 문제는 순수한 통계보다는 R 코딩에 관한 것 같습니다. 예제에서 사용 된 특정 함수의 구문과 기능을 알아야합니다. 이 경우 어떤면에서 주제에 맞지 않습니까? 그렇지 않으면, 당신은 R을 사용하지 않는 사람들에게 무슨 일이 일어나고 있는지 설명해야합니다
Aksakal

답변:


5

위험은 공변량에 따라 다르므로 생존 기능도 마찬가지입니다. 이 모델은 공변량 벡터 를 갖는 개체의 위험 함수 가 따라서이 개인의 누적 위험은 여기서 를 기준 누적 위험으로 정의 할 수 있습니다. 공변량 벡터 를 갖는 개체의 생존 함수 는 차례로 여기서 를 기준 생존 함수로 정의합니다. 엑스

h(;엑스)=h0()이자형β'엑스.
H(;엑스)=0h(;엑스)=0h0()이자형β'엑스=H0()이자형β'엑스,
H0()=0h0()엑스
에스(;엑스)=이자형H(;엑스)=이자형H0이자형β'엑스=에스0()이자형β'엑스
에스0()=이자형H0()

회귀 계수의 추정치 및 및 기준선 생존 함수 가 주어지면 공변량 벡터 를 가진 개체의 생존 함수 추정치는 .β^에스^0()엑스에스^(;엑스)=에스^0()이자형β^'엑스

이것을 R로 계산하면 newdata인수에 공변량 값을 지정합니다 . 예를 들어 R이 70 세인 개인의 생존 함수를 원한다면

plot(survfit(fit, newdata=data.frame(age=70)))

newdata인수를 생략하면 기본값이 표본에있는 공변량의 평균값과 같습니다 (참조 ?survfit.coxph). 따라서 그래프에 표시된 것은 의 추정치입니다 . 에스0()이자형β'엑스¯


동의합니다. 이것은 훌륭하게 작성된 답변입니다. 내 오류로 인해 OP에 사과 드리며 OP가 오류를 수정 한 방식에 감사드립니다.
Michael R. Chernick 2016 년

@ hxd1101 survfit.coxph더 많은 도움말 페이지를 읽은 후 답변의 오류를 수정했습니다. 업데이트를 참조하십시오.
Jarle Tufto

2

20 %의 과목이 남을 것입니다 (예 : 1000 명, 200 일까지 200 명 남음)? 또는 특정인의 경우 200 일에 20 %의 확률로 생존 할 수 있습니까?

가장 순수한 형태의 예에서 Kaplan-Meier 곡선은 위의 진술을 수행하지 않습니다.

첫 번째 진술은 미래를 예측할 수있게한다 . 기본 생존 곡선은 과거의 샘플 만 설명합니다. 예, 샘플의 20 %가 200 일까지 살아 남았습니다. 20 %가 다음 200 일 안에 살아남습니까? 반드시 그런 것은 아닙니다.

이 진술을하기 위해서는 더 많은 가정을 추가하고 모델을 작성해야합니다. 모델은 로지스틱 회귀와 같은 의미에서 통계적 일 필요조차 없습니다. 예를 들어 역학 등에서 PDE가 될 수 있습니다.

두 번째 진술은 아마도 어떤 종류의 동질성 가정에 근거 할 것입니다. 모든 사람들이 동일합니다.


각 사람마다 와 가 다르기 때문에 진술 2가 옳다고 생각하지 않습니다 . 모든 사람이 같다고 어떻게 가정 할 수 있습니까? 엑스β엑스
Haitao Du

@ hxd1011, 모델에 따라 다릅니다. 자동차 부품을 모델링하는 경우 동일한 부품이라고 가정 할 수 있습니다. 반면에 그들의 실패는 배치 번호로 상관 될 수있다. 그리고 그들은 같지 않다.
Aksakal

Cox 모델에 대해 더 구체적으로 질문을 편집했는데 Kaplan_Meier 곡선에 대한 귀하의 답변이 여전히 적용됩니까?
Haitao Du

2

Jarle Tufto의 답변에 감사드립니다. 나는 스스로 대답 할 수 있어야한다고 생각합니다. 두 진술 모두 거짓 입니다. 생성 된 곡선은 이지만 아닙니다 .에스0()에스()

기준 생존 함수 는 때만 같습니다 . 따라서이 곡선은 전체 인구 나 개인을 설명하지 않습니다.에스0()에스()엑스=0


0

첫 번째 옵션이 맞습니다. 일반적으로 는 초기 환자의 20 %가 검열을 고려하지 않고 일 까지 생존했음을 나타냅니다 . 검열 된 데이터에 대해서는 그날 20 %가 아직 살아 있었다고 말하는 것은 정확하지 않습니다. 일부는 추적 관찰을 일찍 잃고 상태가 알려지지 않았기 때문입니다. 더 좋은 방법 은 그날 생존 한 환자의 비율이 20 % 라고 추정 하는 것 입니다. 에스()=0.2

두 번째 옵션 ( 까지 생존이 주어지면 하루 더 생존 할 확률 )은 이며, 는 위험 함수를 나타냅니다.1h()h()

가정과 관련하여 : Cox 회귀 분석 설정에서 일반적인 계수 테스트는 관측 된 공변량에 따라 독립성을 가정한다고 생각 했습니까? Kaplan-Meier 추정조차도 생존 시간과 검열 사이에 독립성을 요구하는 것으로 보입니다 ( 참조 ). 그러나 나는 틀릴 수 있으므로 수정을 환영합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.