MCMC / EM 제한? EM보다 MCMC?


9

현재 R의 JAGS를 사용하는 계층 적 베이지안 모델을 배우고 있으며 Python을 사용하는 pymc ( "Bayesian Methods for Hackers" ) 도 배우고 있습니다.

이 포스트 에서 직관을 얻을 수 있습니다 . "알고 싶은 복잡한 분포에서 독립 표본을 채취 한 것처럼"있는 것처럼 "보이는 숫자 더미로 끝납니다. 조건부 확률을 제공 한 다음 조건부 확률을 기반으로 메모리가없는 프로세스를 생성 할 수있는 것과 같습니다. 프로세스를 충분히 오래 생성하면 조인트 확률이 수렴 할 수 있으며 생성 된 시퀀스의 끝에서 숫자 더미를 가져올 수 있습니다. 복잡한 관절 분포에서 독립 표본을 추출하는 것과 같습니다. 예를 들어, 히스토그램을 만들 수 있고 분포 함수에 근접 할 수 있습니다.

그렇다면 내 문제는 MCMC가 특정 모델에 대해 수렴하는지 여부를 증명해야합니까? 이전에 GMM 및 LDA (그래픽 모델)에 대한 EM 알고리즘을 배웠기 때문에이 사실을 알고 싶습니다. 수렴 여부를 증명하지 않고 MCMC 알고리즘을 사용할 수 있다면 EM보다 훨씬 더 많은 시간을 절약 할 수 있습니다. 예상 로그 우도 함수를 계산해야하고 (사후 확률을 계산해야 함) 예상 로그 우도를 최대화해야합니다. MCMC보다 더 성가신 것 같습니다 (조건부 확률을 공식화하면됩니다).

또한 우도 함수와 사전 분포가 공액인지 궁금합니다. MCMC가 수렴해야한다는 의미입니까? MCMC와 EM의 한계에 대해 궁금합니다.


2
MCMC는 다음과 같이 수렴합니다. 정의에 의해. 대신 수렴을 진단 하여 모델이 수렴되었는지 확인합니다 (예 : math.pku.edu.cn/teachers/xirb/Courses/QR2013/ReadingForFinal/… 또는 people.fas.harvard.edu/~plam/teaching/methods) / convergence /…
Tim

3
EM은 비 베이지안 (모두가 베이지안 통계를 사랑한다)이며, 빠르고 덜 식별 가능성 문제를 (그것이 하나의 수렴이 경우에 최대 MCMC 방법으로 더 많은 포인트 추정 후 복잡 할 수있는 전체 분포를 가지고있는 동안 값 ) 등
Tim

2
EM은 최대 가능성 또는 최대 사후 추정에 사용되지만 처음에는 ML 알고리즘으로 설명되어 있으며 ML 접근 방식에서 일반적으로 사용됩니다 ( en.wikipedia.org/wiki/… 참조 ).
Tim

1
ML 대신 MAP 추정에 EM을 사용하더라도 사후 분포를 특성화하려고 시도하지만 로컬 모드 만 가져 오기 때문에 바이에 시안이 아닙니다.
Luca

1
EM의 경우 관심있는 매개 변수에 대한 포인트 추정치를 제공하고 전체 사후 분포를 정량화하지 않기 때문에 바이에 시안이 아닙니다. EM과 MCMC를 모두 사용하면 사전, 잠재 및 관찰 된 임의 변수가 포함 된 완전한 확률 모델을 가질 수 있지만 추론은 다릅니다. MCMC는 전체 사후 분포를 특성화하는 것을 목표로하지만 EM은 전체 사후 분포의 정보를 전달하지 않습니다. 나를 위해 베이지안은 의사 결정을 위해 사후 분포를 사용하는 사람입니다. 그러나 이것은 간단 할 수 있습니다. 나는 또한이 물건을 배우고 있습니다.
Luca

답변:


13

EM은 최적화 기법입니다. 유용한 잠재 변수가있을 가능성이있는 경우 시작 값에 따라 전역 최대 값일 수있는 로컬 최대 값을 반환합니다.

MCMC는 시뮬레이션 방법입니다. 잠재 변수가 있거나없는 가능성이 주어지면 사전에 사후 분포에서 대략 분포 된 표본을 생성합니다. 해당 샘플의 첫 번째 값은 일반적으로 시작 값에 따라 달라지며 번인 (또는 예열) 단계로 폐기되는 경우가 많습니다.

이 표본을 사후 분포 (대부분의 경우)와 관련된 적분을 평가하는 데 사용하는 경우 수렴 특성은 인체 공학적 정리로 인해 iid Monte Carlo 근사치와 본질적으로 동일합니다.

더 많은 것이 필요한 경우, 즉 보증 (엑스,,엑스+) 후부의 샘플입니다 π(엑스|)예를 들어, R 패키지 CODA 에서 일부 수렴 평가 기법을 사용할 수 있습니다 . 이론적으로 수렴을 보장하는 도구는 아마도 당신의 손이 닿지 않는 것입니다. 예를 들어 완벽한 샘플링 또는 리 웨일 방식 입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.