지수 분포의 ML 추정 (검열 된 데이터 포함)


9

Survival Analysis에서는 rv 의 생존 시간 이 기하 급수적으로 분포 된 것으로 가정합니다 . 이제 i_1 rv의 의 "결과" 가 있다고 생각 합니다. 이러한 결과의 일부만이 실제로 "완전히 실현"됩니다. 즉, 나머지 관측치는 여전히 "살아 있습니다".Xix1,,xnXi

분포 의 속도 모수 에 대해 ML 추정을 수행 하려면 실현되지 않은 관측 값을 일관된 / 적절한 방식으로 어떻게 활용할 수 있습니까? 나는 그들이 여전히 추정에 유용한 정보를 포함하고 있다고 생각합니다.λ

누군가이 주제에 관한 문헌을 안내해 줄 수 있습니까? 나는 그것이 존재한다고 확신한다. 그러나 주제에 대한 좋은 키워드 / 검색어를 찾는 데 문제가 있습니다.


3
따라서 측정 한 랜덤 변수에서 이라고 말하면 관측 값은 "완료된"수명을 나타내며 (관련된 임의의 변수는 측정시 "죽은") 나머지 관측 값은 측정시 "아직 살아남은"랜덤 변수의 생존 길이입니까? ( )nn1<nn2<nn1+n2=n
Alecos Papadopoulos 2012

1
이 모형은 절단 된 모형으로, 관측이 중지 될 때 "생존하는"임의 변수가 절단됩니다.
시안

1
잘린 데이터 및 관련 소스 (예 : 여기 )에 대해서는 Tobit 모델 을 확인 하십시오 .
Richard Hardy

2
평생과 같이 일부 사람들이 사망 한 데이터를 검열 한 것처럼 보이지만 일부는 여전히 살아 있습니다. 따라서 알려진 상수 대해 만 알 수 있습니다. xi>titi
kjetil b halvorsen

3
두 상황 사이의 미묘한 차이에주의하십시오. 잘림이 검열을 위해 혼동되는 것은 드문 일이 아니며 그 반대도 마찬가지입니다.
Alecos Papadopoulos

답변:


17

우도를 직접 사용하여 모수를 추정 할 수 있습니다. 관측치가 지수 분포와 알 수없는 되도록합니다 . 밀도 함수는 , 누적 분포 함수 및 꼬리 함수 입니다. 첫 번째 가정 , 관찰을 충분히 관찰을 잠시 동안 우리는 알고 몇 가지 알려진 양의 상수에 대한x1,,xnλ>0f(x;λ)=λeλx에프(엑스;λ)=1이자형λ엑스G(x;λ)=1F(x;λ)=eλx아르 자형엑스아르 자형+1,,엑스엑스제이>제이제이. 항상 그렇듯이 가능성은 관측 된 관측치에 대한 "관측 된 데이터의 확률"입니다. 즉, 에 의해 제공되므로 전체 우도 함수는 로그 우도 함수는 는 첫 번째 용어 를 제외하고는 일반적으로 완전히 관찰 된 경우에 대한 로그 가능성과 동일한 형식을 갖 습니다. 장소입니다 . 관측치와 검열 시간의 평균에 대해 를 쓰면 의 최대 우도 추정값 은(엑스제이>제이)=(제이;λ)

(λ)=나는=1아르 자형에프(엑스나는;λ)나는=아르 자형+1(제이;λ)
(λ)=아르 자형로그λλ(엑스1++엑스아르 자형+아르 자형+1++)
아르 자형로그λ로그λλλ^=아르 자형 은 완전히 관찰 된 사례와 비교할 수 있습니다.
 EDIT   

모든 의견 이 검열 된 경우 즉, 어떤 사건 (사망)을 관찰 할만큼 오래 기다리지 않았다면 어떻게해야합니까? 이 경우 이므로 로그 우도는 즉 에서 선형 감소 합니다. 따라서 최대 값은 이어야합니다 ! 그러나 0은 비율 분포와 일치하지 않으므로 rate 매개 변수 유효한 값 이 아닙니다. 이 경우 최대 우도 추정기가 존재하지 않는다는 결론을 내려야합니다! 아마도 대한 일종의 신뢰 구간을 구성하려고 시도 할 수 있습니다.아르 자형=0

(λ)=λ
λλ=0λλ로그 가능성 함수를 기반으로? 이를 위해 아래를보십시오.

그러나 어쨌든,이 경우 데이터의 실제 결론은 이벤트가 발생할 때까지 더 많은 시간을 기다려야한다는 것입니다 ...

모든 관측치가 검열되는 경우 에 대해 (단일) 신뢰 구간을 구성하는 방법은 다음과 같습니다 . 이 경우의 우도 함수는 이며, 이는 우리가 모든 성공을 얻은 이항 실험의 우도 함수와 동일한 형식을 가지며 ( 이항 추정치에 대한 신뢰 구간 참조 ). 0 또는 1 ). 이 경우 에 대해 형식의 단측 신뢰 구간을 원합니다 . 그런 다음 를 해결 하여 간격을 얻습니다 .λ이자형λ[¯,1]λ로그=λ

우리에 대한 신뢰 구간 얻을 해결하여 있도록 . 이것은 : 대한 신뢰 구간을 제공합니다

(엑스=)=0.95    (말하다)
로그로그0.95λ
λ로그0.95.

1
질문과 답변을 읽고 " 모든 관측치가 이고 관측치가 완전히 관측되지 않은 두 번째 유형 인 경우 어떻게됩니까?"라고 생각했습니다. 이 사례를 확장명으로 답변에 포함시키는 것이 정말 유용합니다. 엑스제이>제이
Alecos Papadopoulos 2012
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.