Dirichlet 공정에서 농도 매개 변수에 사전 설정


9

이것의 대부분은 배경 입니다. Dirichlet 프로세스 혼합물에 대해 이미 충분히 알고 있다면 끝으로 건너 뛰십시오 . 내가 할 수 즉, 디리클레 프로세스의 혼합물로부터 들어오는 일부 데이터를 모델링하고 가정 과 조건으로 가정FD(αH)F

Yiiidf(y|θ)F(dθ).

여기서 및 가 이전 기본 측정입니다. 각 관측 값 에 대해 관련된 잠재 알고 있으면 이 모델에서 의 가능성 은 여기서 는 의 고유 한 값의 수입니다 (임의 측정 값 는 거의 확실합니다). Escobar와 West 는 감마를 사용하여 를 샘플링하기 위해 다음과 같은 체계를 개발합니다 . 먼저, 그들은 쓴다α>0αHYiθiα

L(α|t)αtΓ(α)Γ(α+n)
tθiFα
π(α|t)π(α)αtΓ(α)Γ(α+n)π(α)αt1(α+n)B(α+1,n)=π(α)αt1(α+n)01xα(1x)n1 dx,
여기서 는 베타 함수입니다. 그런 다음 잠복 매개 변수 을 도입하면 그 가능성은 감마 분포의 혼합 형태이며 이것을 사용하여 Gibbs 샘플러를 작성합니다.B(,)XBeta(α+1,n)

이제 내 질문입니다. 왜 우리는 단지 감마 분포 혼합 대신 단일 감마 분포를 사용합니까? 우리가 를 소개하면 같은 것을 할 수는 없지만 혼합물을 사용할 필요는 없습니까?

L(α|t)αtΓ(α)Γ(α+n)=αtΓ(n)Γ(α)Γ(α+n)Γ(n)=αtB(α,n)Γ(n)αt01xα1(1x)n1 dx,
XBeta(α,n)

자세한 내용을 보려면 편집하십시오. 자세한 내용 : 약간의 차이를 메우기 위해 Escobar와 West의 논증은 에 감마 분포가 모양 이고 평균 , 그래서 우리는 소개 할 수 있습니다 잠상 되도록전체 조건은 에 대한 분포 와 와 a 의 혼합입니다 .αaa/b

π(α|t)αa+t2(α+n)ebα01xα(1x)n1 dx
X
π(α,x|t)αa+t2(α+n)ebαxα(1x)n1.
Beta(α+1,n)XG(a+t,blog(x))G(a+t1,blog(x)) 대해 .α

동일한 인수, I는 동일한 결과를 얻었다 그러나와 대한 및 에 대한 . 이것은 나에게 더 쉬운 것 같다; 왜 그렇게하지 않습니까?Beta(α,n)XG(a+t,blog(x))α

답변:


3

당신이 쓴 것이 Escobar와 West와 근본적으로 어떻게 다른지 모르겠습니다.

π(α|t)π(α)π(t|α)=π(α)L(α|t)π(α)αtΓ(α)Γ(α+n)π(α)αtΓ(α)Γ(n)Γ(α+n)=π(α)αtB(α,n)=π(α)αt1(α+n)B(α+1,n)
여기서 두 번째 줄부터 마지막 ​​줄은 당신이 가진 방법이고 마지막 줄은 E & W가 가진 방법입니다. 이후 그들은 동일한 n) \ end {eqnarray *}는 다음과 같이 회상합니다.
αB(α,n)=αΓ(α)Γ(n)Γ(α+n)=(αΓ(α))Γ(n)(α+n)(Γ(α+n)(α+n))=(α+n)Γ(α+1)Γ(n)Γ(α+n+1)=(α+n)B(α+1,n)
Γ(z+1)=zΓ(z) 입니다.

나는 그들이 베타와 감마의 곱이 아닌 베타 기능 용어 만 가지고 있기 때문에 그들이 당신의 공식보다 선호하는 것으로 추측합니다. 그러나 나는 틀릴 수 있습니다. 나는 당신이 쓴 마지막 비트를 따르지 않았습니다. 샘플링 체계에 대해 더 명확 할 수 있습니까?


내 게시물에 추가 정보가 추가되었습니다.
guy
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.