최소 지수 분포에 대한 최대 가능성 추정기


10

이 문제를 해결하는 방법에 붙어 있습니다.

따라서 대해 두 개의 랜덤 변수 시퀀스 및 가 있습니다. 이제 와 는 매개 변수 및 갖는 독립적 인 지수 분포입니다 . 그러나 와 를 관찰하는 대신 와 관찰합니다 .Y I I = 1 , . . . , n X Y λ μ X Y Z WXiYii=1,...,nXYλμXYZW

Z=min(Xi,Yi)Z_i = X_i 인 경우 W = 1 이고 Z_i = Y_i 인 경우 0 입니다. ZW를 기준으로 \ lambda\ mu 의 최대 가능성 추정값에 대한 닫힌 양식을 찾아야 합니다. 또한 우리는 이것이 세계 최대라는 것을 보여줄 필요가 있습니다.W=1Zi=XiZi=YiλμZW

이제 두 개의 독립적 인 지수의 최소값 자체가 속도의 합계와 같은 지수 라는 것을 알고 있으므로 Z 는 매개 변수 \ lambda + \ mu 인 지수입니다 λ+μ. 따라서 최대 가능성 추정치는 λ^+μ^=Z¯ 입니다.

그러나 나는 여기서 어디로 가야할지에 갇혀 있습니다. Wp = P (Z_i = X_i) 매개 변수를 가진 Bernoulli 분포 라는 것을 알고 p=P(Zi=Xi)있지만 매개 변수 중 하나에 대한 명령문으로 변환하는 방법을 모르겠습니다. 예를 들어, MLE W¯λ 및 / 또는 \ mu의 관점에서 무엇을 추정 μ합니까? 본인은 경우 Zi=Xi , 다음 μ=0 ,하지만 난 여기에, 어떤 대수 문을 마련하는 방법을 알아내는 힘든 시간을 보내고 있습니다.

업데이트 1 : ZW 의 공동 분포에 대한 가능성을 도출하기 위해 의견에서 들었습니다 W.

따라서 여기서 입니다. 옳은? 와 가 독립적이지 않기 때문에이 경우 공동 분포를 파생시키는 다른 방법을 모르겠습니다 .f(Z,W)=f(Z|W=1)p+f(Z|W=0)(1p)p=P(Zi=Xi)ZW

따라서 이것은 위 의 정의에 의해 을 제공합니다 . 그러나 지금 무엇? 이것은 어디서나 나를 얻지 못합니다. I는 우도를 계산하는 단계를 진행하는 경우, I 얻을 (하여 및 혼합물의 각 부분으로서 샘플 사이즈 ...)f(Zi,Wi)=pλeλzi+(1p)μeμziWmn

L(λ,μ)=pmλmeλzi+(1p)nμneμzi

logL=mlogp+mlogλλzi+nlog(1p)+nlogμμzi

부분 미분을 취하면 및 대한 MLE 추정치가 에 대한 의 평균 조건에 불과 하다는 것을 알 수 . 그건,λμZW

λ^=Zim

μ^=Zin

p^=mn+m


1
오늘 비슷한 MLE 질문에 답한 후에 몇 가지 아이디어에 대한 솔루션으로 안내해 드리겠습니다 . 질문 간의 관계는 데이터가 자연스럽게 두 개의 분리 된 그룹으로 나뉩니다 그룹 과 입니다. 그것은 모두 형식의 관측에 대한 가능성을 기록하는 것입니다 . 와 사이의 대칭 인 와 는 즉시 형식의 데이터에 대한 가능성을 생성 한 다음 벗어납니다. W=0W=1(Z,W)=(z,0)XYμλ(z,1)
whuber

최대한의 가능성을 쓰려고 서두르지 마십시오! 먼저 의 공동 분포를 표현한 다음 의 표본과 관련된 가능성을 추정합니다. 지수 가정으로 인해 닫힌 형태입니다. 그런 다음에야 함수를 최대화하려고 시도 할 수 있으므로 최대한의 가능성을 얻을 수 있습니다. (Z,W)(Zi,W)=i)
시안

@whuber : (+1) 그것은 간단 참으로 오히려이고 사이의 거리를 포함한다 의과 그러나 그룹은 포함 모두 와 그들이에 대한 정보를 가지고 있기 때문에, 모두 및 보낸 . (zi,1)(zi,0) μλ XiYiWi=I(Xi<Yi)
시안

2
@ Xi'an 맞아요. 그리고 제가 계속 연결하기 위해 연결하는 Normal-theory 예제와 비슷한 점은 두 그룹 모두 공통 매개 변수 (스케일) 에 대한 정보를 제공하기 때문에 추정에는 "풀링"데이터가 포함 되기 때문입니다 그룹에서. 여기서 는 의 추정치 ( 에 대한 비율 또는 역 척도 )를 와 의 개별 추정치로 어떻게 할당해야하는지 알려줍니다 . σW¯λ+μZλμ
whuber

나는 다른 스레드 인 whuber를 읽었지만 솔직히이 예제에 적용하는 방법을 이해하지 못합니다. Z와 W는 독립적이지 않으므로 관절 분포를 어떻게 도출합니까?
Ryan Simmons

답변:


1

언급 할 점이 충분하지 않으므로 여기에 쓰겠습니다. 다음을 고려하면 게시 한 문제를 생존 분석 관점에서 볼 수 있다고 생각합니다.

Xi : 진정한 생존 시간

Yi : 검열 시간

둘 다 와 독립적으로 지수 분포를 갖습니다 . 이어서 관측 생존 시간이고 검열 표시기.XYZiWi

생존 분석에 익숙하다면이 시점부터 시작할 수 있다고 생각합니다.

참고 : 좋은 출처 : DRCox 및 D.Oakes에 의한 생존 데이터 분석

아래는 예입니다. 생존 시간 분포의 pdf가 합니다. 생존 함수는 입니다. 그리고 로그 가능성은 다음과 같습니다.f(t)=ρeρtS(t)=eρt

l=ulogf(zi)+clogS(zi)

무수정 된 사람들 ( )과 검열 된 사람들 ( ) 각각에 대한 합산 .uc

인해 사실을 여기서, H (t)는 위험 기능이 작성 될 수있다 :f(t)=h(t)S(t)

l=ulogh(zi)+logS(zi)

l=ulogρρzi

그리고 최대 우도 추정 의 있습니다 :ρ^ρ

ρ^=d/zi 여기서 는 의 총 사례 수입니다.dWi=1

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.