시간 종속 변수가있는 반복 이벤트 데이터에 대한 데이터 구조 및 함수 호출


9

환자가 넘어 질 가능성에 대한 2 가지 약물 ( drug1, drug2) 의 효과를 추정하려고합니다 ( event). 환자는 한 번 이상 넘어 질 수 있으며 언제라도 약물을 복용하거나 제거 할 수 있습니다.

내 질문은 기간 (일)과 관련하여 데이터를 구성하는 방법, 특히 일 사이에 겹칠 필요가 있는지 여부입니다. 내 구조가 잘못되었다고 생각하는 데는 두 가지 이유가 있습니다 N. 또한 기간이 하루 (즉 time1=4, time2=4) 인 곳에서 약간의 오류가 발생하며 어떻게 코딩 해야하는지 잘 모르겠습니다. 후속 항목의 시작 시간이 이전 항목의 중지 시간이어야합니까? 나는 그것을 두 가지 방법으로 (겹침이 있거나없는) 시도했지만 겹침이 경고를 제거하는 동안 N여전히 잘못되었습니다.

Warning message:
In Surv(time = c(0, 2, 7, 15, 20, 0, 18, 27, 32, 35, 39, 46, 53,  :
  Stop time must be > start time, NA created

지금은 다음 항목의 시작이 다음 날인 곳에 데이터를 설정했습니다. 고유 한 환자는로 식별됩니다 chart numbers.

Time1    Time2    Drug1    Drug2   Event    ChartNo
    0        2        1        0       0        123
    3       10        1        1       1        123
   11       14        1        1       1        123
    0       11        0        1       0        345
    0       19        1        0       1        678
    0        4        0        1       0        900
    5       18        1        1       0        900

환자 123은 시작 2 일째에 약물 1에 있었으며, 그 후에 약물 2가 첨가되었다. 그들은 처음으로 떨어지기 전에 두 약물에 대해 3 일부터 10 일까지 갔다가 14 일에 두 번째 약물을 복용 한 상태에서 두 약물을 복용했습니다. 환자 345는 11 일 동안 약물 2를 쓰러 뜨리지 않고 검열했습니다.

실제 추정치는 다음과 같습니다.

S <- Srv(time=time1, time2=time2, event=event)
cox.rms <- cph(S ~ Drug1 + Drug2 + cluster(ChartNo), surv=T)

나의 주요 관심사는 실제로 나는 유일한 환자 가있을 때 n분석이 2017(데이터의 행 수 ) 로보 고된다는 것 314입니다. 이것이 정상인지 또는 내가 진행 한 일부 오류의 결과인지 확실하지 않습니다.

> cox.rms$n
Status
No Event    Event 
    1884      133 

coxph()서바이벌 패키지에서 사용할 때도 마찬가지입니다 .

 n= 2017, number of events= 133

그러나 이벤트 수는 정확합니다.

이 게시물 은 내가 설명 한 '중복'으로 설정되어있는 것 같지만에 대해 확실 N하지 않으며에 의해 클러스터링되지 않은 것 같습니다 ID.


+cluster(ChartNo)용어는 반복적 인 관찰 문제를 처리해야합니다. 다른 방법은 + (1|subject)coxme :: coxme 분석 에 추가 하는 것 입니다.
DWin

답변:


1

데이터 형식이 정확합니다.

반복되는 사건과 시간에 따라 변하는 공변량 인 약물의 복잡성으로 인해 환자 당 여러 개의 기록이 있습니다. 인쇄 한 결과 head는 이러한 데이터를 이해하는 데 도움이됩니다.

시변 공변량뿐만 아니라 반복되는 사건을 분석하는 일반적인 방법은 각 행이 위험 공변량 관측 간격을 나타내는 "긴"형식으로 데이터를 형식화하는 것입니다. 예를 들어, 환자 123이 시간 0에서 시간 2까지의 약물 1에만 있고, 시간 1에서 약물 1과 약물 2를 모두 복용하도록 변경되는 것을 볼 수 있습니다. 그들이 1 번 약물을 계속 복용 할 경우 그들의 추락이 얼마나 오래 걸릴지 알 수 없기 때문에이 시점에서 검열됩니다. 3시에 그들은 7 개의 시간 단위 동안 두 약물을 모두 복용 한 환자로 코딩 된 코호트에 다시 들어간 후 첫 가을을 경험한다. 그들은 단지 4 시간 단위 후에 동일한 약물 조합에서 두 번째 가을을 경험합니다.

레코드 수는 코호트 데이터의 유용한 요약이 아닙니다. 행의 수가 환자의 수보다 훨씬 많다는 것은 놀라운 일이 아닙니다. 대신, 처음부터 끝까지 시간을 합산하여 위험에 처한 사람의 시간으로 기록하십시오. 코호트 분모는 발생률을 이해하는 데 유용합니다. 원시 환자 수를 요약하는 것도 유용하지만 데이터 세트의 행 수보다 작은 데이터는 "긴"형식임을 명심하십시오.

오류로 인해 "정지"날짜에 1 단위를 추가해야 할 수도 있습니다. 환자 123이 0 일, 1 일 및 2 일 동안 약물 1을 복용 한 다음 3 일에 약물 2를 시작하면 약물 1에 대한 위험이 3 일 발생했습니다. 그러나 2-0 = 2이며 이는 올바르지 않습니다. 분모.

"클러스터"인수가 수행하는 (일반적으로) 약점은 약점을 의미하며, 이는 여러 가지 측정되지 않은 위험 요소로 인한 비례 위험 차이를 설명 할 수있는 임의의 가로 채기 유형입니다. 나는 종종 연약함을 가지고 분석을하지 않습니다. "cluster"명령을 생략하고 결과를 발생률로 해석 할 수 있습니다. 모든 환자에서 첫 번째로 떨어질 때까지 콕스 모델을 교대로 맞출 수 있으며 위험 비율을 위험 비율로 해석 할 수 있습니다. 연약한 결과는이 둘 사이 어딘가에 있어야한다고 생각하며 해석이 무엇인지 분명하지 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.