MCMC는 언제 유용합니까?


12

MCMC 접근 방식이 실제로 유용한 상황을 이해하는 데 어려움을 겪고 있습니다. 저는 Kruschke 저서 "Does Bayesian Data Analysis : A Tutorial with R and BUGS"의 장난감 예제를 보겠습니다.

내가 지금까지 이해 한 것은 P ( θ | D ) 의 표본을 가지기 위해서는 p(D|θ)p(θ) 에 비례하는 목표 분포가 필요하다는 것 입니다. 그러나 일단 p ( D | θ ) p ( θ )를 가지면 사후 구하기 위해 분포를 정규화하기 만하면되고 정규화 계수를 쉽게 수치로 찾을 수있을 것 같습니다. 이것이 가능하지 않은 경우는 무엇입니까?P(θ|D)p(D|θ)p(θ)


2
θ 가 스칼라가 아니라 10000 차원 의 벡터 라고 가정하십시오 . θ
Jan Galkowski 2019

1
내 대답은 조금 간결했다. 상수를 얻으려면 p(D|θ)p(θ) 합니다. 스칼라 경우에도 p(D|θ) 가 정말 놀랍기 때문에 수치 적으로도 통합이 어렵다고 가정합니다. 그런 다음 MCMC를 사용할 수 있습니다.
Jan Galkowski 2019

2
Alan Sokal의 경고 : "Monte Carlo는 매우 나쁜 방법입니다. 모든 다른 방법이 최악 인 경우에만 사용해야합니다." 그런 다음 그는 MC 방법에 대한 긴 토론을 시작합니다. stat.unc.edu/faculty/cji/Sokal.pdf
Yair Daon

1
@Yair : Sokal이 처칠을 채널로 보내는 것처럼 들립니다.
추기경

1
아무것도 다른 작동하지 않습니다 때 ...
할보 르센 kjetil B

답변:


10

Monte Carlo 적분 은 수치 적분의 한 형태로 , 예를 들어, 정수를 다항식으로 근사하여 수치 적분보다 훨씬 효율적일 수 있습니다 . 이는 단순한 수치 적분 기술이 많은 함수 평가를 요구하는 높은 차원에서 특히 그렇습니다. 정규화 상수 를 계산하기 위해 중요도 샘플링을 사용할 수 있습니다 .p(D)

p(D)=q(θ)q(θ)p(θ)p(Dθ)dθ1Nnwnp(θn)p(Dθn),

여기서 및 은 에서 샘플링됩니다 . 샘플링 된 지점에서 관절 분포 만 평가하면됩니다. 올바른 ,이 추정기는 샘플이 거의 필요하지 않다는 점에서 매우 효율적일 수 있습니다. 실제로 적절한 선택하는 것은 어려울 수 있지만 MCMC가 도움을 줄 수있는 곳입니다! 어닐링 된 중요도 샘플링 (Neal, 1998) 은 MCMC와 중요도 샘플링을 결합합니다.wn=1/q(θn)θnqqq

MCMC가 유용한 또 다른 이유는 다음과 같습니다. 우리는 일반적으로 의 사후 밀도에 관심이있는 것이 아니라 요약 통계 및 기대 에 관심이 있습니다.θ

p(θD)f(θ)dθ.

아는 것이 일반적으로이 적분을 해결할 수 있다는 것을 의미하지는 않지만 표본은 추정하기에 매우 편리한 방법입니다.p(D)

마지막으로, 를 평가할 수있는 것은 일부 MCMC 방법의 요구 사항이지만 모든 방법이 아닙니다 (예 : Murray et al., 2006 ).p(Dθ)p(θ)


미안하지만 이것은 아직 명확하지 않습니다. 내 질문은 : 우리가 를 곱하면 정규화되지 않은 pdf를 얻습니다. MCMC를 실행하여 정규화되지 않은 pdf를 추정 할 수있는 샘플을 얻습니다. 원한다면 둘 다 정규화 할 수 있습니다. 따라서 어떤 요약 통계에는 관심이 없지만 사후에만 관심이 있는데 왜 MCMC를 먼저 사용합니까? 당신이 말했듯이, 일부 MCMC 방법은 의 계산을 필요로하지 않으므로 , 그것들을 언급하지 않습니다. 내가 아는 한, 그들 대부분은 그 계산이 필요합니다. 이 방법의 유용성은 무엇입니까? p(D|θ)p(θ)p(D|θ)p(θ)
Vaaal

2
MCMC를 실행할 때 정규화 된 PDF 에서 샘플을 얻으 므로 정규화 상수를 계산하지 마십시오. 그리고 이것은 무료입니다.
시안

2
@Vaaal : "정규화 인자를 쉽게 찾을 수있다"는 가정 은 단순한 일 변량 분포에만 적용됩니다. 고차원 , 정규화 는 일반적으로 매우 어렵습니다. 이 경우에도 MCMC를 사용하여 정규화 상수를 추정 할 수 있습니다 (예 : 어닐링 된 중요도 샘플링을 통해). θp(Dθ)p(θ)
Lucas

6

닫힌 형태로 계산할 수 없거나 사후 분포 와 같이 계산할 수없는 이전 및 가능성 가 제공되는 경우 는 표준 유형이 아니며,이 분포에서 사후 분포의 Monte Carlo 근사를 향해 직접 시뮬레이션하는 것은 불가능합니다. 일반적인 예는 BUGS 책 에서 볼 수있는 것과 같이 비 접합 사전이있는 계층 모델로 구성 됩니다.p(θ)f(x|θ)

p(θ|x)p(θ)f(x|θ)

이러한 수락 거부-같은 간접 시뮬레이션 방법, 비율-의 균일, 또는 중요성 샘플링 기술은 통상적으로 수치 및 정밀 어려움으로 실행할 때 매개 변수의 차원 몇 단위 이상으로 증가한다.θ

반대로, Markov 체인 Monte Carlo 방법은 지역 차원, 즉 현재 값의 근방 및 소수의 구성 요소, 즉 부분 공간에서 사후 분포를 탐색 할 수 있다는 점에서 큰 차원에 더 적합합니다. 예를 들어 Gibbs 샘플러 는 한 번에 1 차원 대상에서 시뮬레이션, 즉 와 관련된 전체 조건부 분포 가 장기적으로 실제 후부에서 시뮬레이션을 달성하기에 충분하다는 개념을 검증합니다.p(θ|x)

Markov chain Monte Carlo 방법은 Metropolis-Hastings 알고리즘과 같은 알고리즘 을 일정하게 계산할 수있는 모든 사후 분포 공식적으로 사용할 수 있다는 점에서 어느 정도 보편성입니다 .p(θ|x)

경우 쉽게 계산 될 수없는 대안이 존재 하나에서와 같이,보다 큰 공간을 통해 관리 분포에이 분포를 완료하여 또는 ABC 와 같은 비 Markovian 방법을 통해 .p(θ)f(x|θ)

p(θ)f(x|θ)g(z|θ,x)p(θ)f(x|θ)dz

MCMC 방법은 1990 년 Alan Gelfand와 Adrian Smith가이 방법을 대중화 한 이후의 상승에 의해 설명 된 것처럼 베이지안 방법에 대해 훨씬 더 넓은 범위를 제공했습니다.


버그 북에 대한 링크가 더 이상 작동하지 않습니다.
HelloWorld
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.