중복을 처리하는 랜덤 효과 모델


9

반복 이진 결과를 사용하여 이벤트 시간 분석을 처리하려고합니다. 이벤트 시간은 일 단위로 측정되지만 현재는 시간을 주 단위로 이산한다고 가정합니다. 반복되는 이진 결과를 사용하여 Kaplan-Meier 추정량을 근사하고 싶지만 공변량을 허용하고 싶습니다. 이것은 원형 교차로처럼 보일 것이지만 이것이 서수 결과와 반복되는 사건으로 어떻게 확장되는지 탐구하고 있습니다.

3 주에 검열 된 사람의 경우 000과 같고 4w에 검열 된 사람의 경우 0000, 5w에 실패한 과목의 경우 0000111111111111 .... 인 이진 시퀀스를 만드는 경우 (1은 마지막 주제가 있었던 시점까지 확장 됨) 1 주일에 특정 비율을 계산할 때 일반적인 누적 발생률을 얻을 수 있습니다 (가변 관측 중단 시간에 도달 할 때까지는 Kaplan-Meier 누적 발생률 추정치와 비슷하지만 동일하지 않음).

위와 같이 시간을 달리하지 않고 스플라인을 사용하는 대신 GEE를 사용하여 이진 로지스틱 모델로 반복 이진 관측치를 맞출 수 있습니다. 군집 샌드위치 공분산 추정기는 합리적으로 잘 작동합니다. 그러나 혼합 효과 모델을 사용하여보다 정확한 추론을 얻고 싶습니다. 문제는 첫 번째 1 이후의 1이 중복된다는 것입니다. 표준 오류가 줄어들지 않도록 임의 효과를 지정하거나 중복성을 고려하는 모델을 지정하는 방법을 아는 사람이 있습니까?

이 설정은 로지스틱 모델을 사용하여 위험 세트의 조건부 확률을 추정했기 때문에 Efron 과 다릅니다 . 무조건 확률을 추정하고 있습니다.

답변:


3

반복 이진 관측에 대해 GEE 또는 혼합 모형으로 볼 수있는 한, 첫 번째 '1'이 관측 된 후 모형이 '0'에 대해 양의 확률을 할당한다는 문제가 있습니다.

어쨌든 GEE에서와 동일한 해석을 갖는 혼합 효과 로지스틱 회귀 분석에서 추정치를 얻으려는 경우 (자세한 내용은 여기 참조 ) GLMMadaptive 패키지 의 mixed_model()함수를 사용하여 모형을 적합 화 한 다음 사용하십시오 . 예를 들어 여기를 참조 하십시오 .marginal_coefs()


1
고마워 Dimitris. 여분의 1을 사용하는 경우 (평균 기능을 올바르게 사용하려면) 수정 된 모델이나 이상한 임의 효과 설정이 필요하다고 생각합니다. GLMMadaptive패키지는 일반적인 설정에 훌륭한 보인다.
Frank Harrell 1

2

이것에 대한 몇 가지 생각 :

  1. 혼합 효과 모델은 기본적으로 '조건부'확률 모델 인 것으로 보입니다. 즉, 해당 이벤트에 위험이있는 대상에 대한 이벤트의 확률은 무엇입니까?

  2. 우리는 첫 번째 '1'이후 '1'의 확률이 1이라는 것을 알고 있습니다. 따라서 후속 '1'값에는 추가 정보가 없습니다.

  3. 후속 '1'값은 추가 정보를 포함하지 않으므로 가능성 함수에 영향을 미치지 않아야하므로 가능성 기반 추정량의 표준 오차 나 추정치 자체에는 영향을 미치지 않습니다. 실제로, 모델 매개 변수 값과 상관없이 p (y = '1'| x) = 1이면 후속 '1'값에 영향을 미치지 않습니다.

  4. 우리는이 행동을 강제 할 수 있고 (즉, p (y = '1'| x) = 1), 다음 모델을 나타내는 모델에 지표 공변량을 추가하고 계수를 강제함으로써 원하는 평균 함수를 유지할 수 있습니다 효과적으로 p (y = '1'| x) = 1이되도록 매우 커야합니다.

  5. 언급했듯이 첫 번째 '1'과 후속 응답이 100 % 상관 관계를 갖도록하는 방법도 있습니다. 그러나 이항 모형에서는 후속 반응의 p (y = '1'| x) = 1과 같습니다.


1
고마워 매트. 전체 모델을 원하지는 않지만 추정 방정식에 만족하는 경우 점수 함수에 중복 응답을 추가하여 평균 함수를 올바르게 얻는 것이지만 정보 함수에는 추가하지 않는 것입니다. 지표 공변량을 추가 할 수 있다고 생각하지 않습니다. 예를 들어, 치료 효과와 관련이 있기 때문입니다. 혼합 효과 모델을 무조건 모델이라고 생각합니다. 이벤트가 흡수 상태가 아닌 경우 시간에 따라 주변 효과를 모델링합니다.
Frank Harrell

1

나는 당신이 무엇을하려고하는지 확실하지 않지만 풀 로지스틱 회귀 모델 ( https://www.ncbi.nlm.nih.gov/pubmed/2281238 )에 적합 할 수 있습니까? 이 경우 터미널 이벤트 간격 동안 1 만 포함하면됩니다. 이벤트가 발생한 후에는 반복되지 않습니다. 유연한 방식으로 모델에 시간을 포함시킬 수 있습니다 (예 : 스플라인을 사용하여 확장).


1
안녕 브라이언-나는 풀 로지스틱 회귀를 좋아하고 자주 사용했습니다. 그러나 터미널 이벤트에서 주제의 관찰을 종료하고 이벤트없이 해당 주제를 넘어 다른 주제를 추적하면 평균 함수 (P (이벤트 t x))가 잘못됩니다. 적어도 특별한 경우 평균 함수에 대한 Kaplan-Meier 누적 발생률 근처에 접근하고 싶습니다.
Frank Harrell
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.