MCMC의 실제 예


14

나는 MCMC와 관련된 강의를하고있었습니다. 그러나 나는 그것이 어떻게 사용되는지에 대한 좋은 예를 찾지 못했습니다. 누구든지 구체적인 예를 들어 줄 수 있습니까? 내가 볼 수있는 것은 Markov 체인을 실행하고 고정 분포가 원하는 분포라고 말합니다.

원하는 분포를 샘플링하기 어려운 좋은 예를 원합니다. Markov 체인을 만듭니다. Markov 체인의 고정 분포가 대상 분포가되도록 전이 행렬을 선택하는 방법을 알고 싶습니다.


기본 마코프 체인 이론은 특정 샘플링 방식이 원하는 조인트 분포 인 고정 분포를 가질 것이라는 것을 보여주기 위해 사용됩니다. 가장 간단한 예를 들어, 바닐라 깁스 샘플러는 전체 조건부 분포에서 시뮬레이션합니다. 수렴 조건 (만약 간단하게 보여주기 위해)을 만족시키는 경우, 대응하는 전이 커널은 함께 고정 분포로서 조인트 분포를 갖는 것으로 쉽게 보여 질 수있다. 대도시 헤이스팅스와 유사합니다. 당신이보고있는 강의가 MCMC가 마르코프 체인 인 방법을 설명하지 않는 것
같습니다.

답변:


3

샘플링하기 어려운 배포판의 좋은 예는 하드 코어 모델입니다. 개요는이 페이지를 참조하십시오.

http://www.mathematik.uni-ulm.de/stochastik/lehre/ss06/markov/skript_engl/node34.html

이 모델은 일부 고정 n에 대해 그리드에 대한 분포를 정의합니다. 그리드의 각 점에서 1 또는 0의 값을 가질 수 있습니다. 하드 코어 모델에서 그리드를 허용하기 위해 그리드의 인접한 두 지점은 모두 1의 값을 가질 수 없습니다.×

아래 이미지 는 하드 코어 모델에서 그리드에 허용되는 구성 예를 보여줍니다 . 이 이미지에서 하나는 검은 점으로 표시되고 0은 흰색으로 표시됩니다. 두 개의 검은 점은 인접하지 않습니다.8×8

하드 코어 모델에서 $ 8 \ times 8 $ 그리드에 허용되는 구성 예

저는이 모델에 대한 영감이 물리학에서 나온 것이라고 생각합니다. 그리드의 각 위치를 입자라고 생각할 수 있으며 그 위치의 값은 전하 또는 스핀을 나타냅니다.

우리는 허용 가능한 그리드의 집단에서 균일하게 샘플링하고 싶습니다. 즉 가 허용 가능한 그리드의 집합 인 경우 e E 를 샘플링 하여이자형이자형이자형

(이자형)=1|이자형|

어디 |이자형|허용 가능한 모든 구성 수입니다.

우리가 n을 고려하고 있음을 감안할 때 이것은 이미 도전 과제입니다. 그리드, 우리는 방법을 결정할 수 | 전자 | 허용 가능한 그리드 수? ×|이자형|

MCMC의 좋은 점 중 하나는 정규화 상수를 평가하기 어렵거나 불가능한 분포에서 표본을 추출 할 수 있다는 것입니다.

이 문제에 대해 MCMC를 구현하는 방법에 대한 세부 정보에 대한 논문을 읽도록하겠습니다. 그러나 비교적 간단합니다.



2

통계에서 또 다른 어려운 문제. 문제는 오래되었지만 온라인의 소개 예제는 찾기가 어렵습니다. MCMC에 의해 여기 에 PageRank 토지 의 Markov 랜덤 보행을 따르는 누군가 가 따라 가기 쉬운 대답에 대한 기대로 가득 찬 경우를 대비하여 두 가지 훌륭한 예를 단순화하겠습니다 . 가능성은? 후속 질문이 될 수 있습니다.

FIRST EXAMPLE:

(0,1)

모든 기계적인 단계를 거친 후에는 하나의 마술적인 트릭, 즉 제안 된 값수락 하거나 거부 하는 이진 결정이 있다는 것을 깨닫기가 어렵다 .

엑스mean0sd 1rnorm(10000)

epsϵ엑스나는엑스나는+1runif(1, - eps, eps)엑스나는

따라서 제안 된 모든 값은 임의의 방식으로 이전 값과 다를 수 있습니다. [- eps,+ eps] .

나는나는+1

(0,1)엑스나는+1xi

min(1, dnorm(candidate_value)/dnorm(x))1N(0,1) pdfxi+1ximin(1, ...)dnorm , 그것의 높은 확률이 허용된다.

min(1, dnorm(candidate_value)/dnorm(x))runif(1)01x[i+1]x[i]

sd10 .

0x = 0; vec[1] = x

SECOND EXAMPLE:

이것은 더욱 흥미롭고, 데이터 세트에 주어진 임의의 매개 변수에 대한 로그 우도를 계산하여 선형 회귀 곡선의 매개 변수 추정 을 참조합니다 . 그러나 코드 라인의 주석은 첫 번째 예제와 매우 유사한 단계에 따라 여기저장된 압축 시뮬레이션에 빌드됩니다 .


몇 가지 사소한 수정이 필요했습니다. "" CMCM에 의해 여기에 착륙했습니다 "... " Rosenbluth-Hatings ".... 아마도 거기에 여분의 "s"가 필요할 것입니다. 첫 번째 예제는 정확히 "샘플하기 어렵다"는 것이 아니라고합니다 (질문에서 알 수 있듯이). 두 사례 모두 Metropolis-Hastings (확실히 중요한)이지만 MCMC 이상의 것입니다. 일례로, 많은 사람들이 종종 JAGS / BUGS / etc를 통해 Gibbs 샘플링을 사용합니다. 제안 된 단계의 수락과 관련된 결정은 없습니다. 항상 움직입니다.
Glen_b-복지 주 모니카

CMCM 이성체 철자 인 "s"가 누락되었습니다. 이름 문제를 해결하는 YouTube에 대한 잠재적으로 불필요한 하이퍼 링크를 제거했습니다. (오래된) 질문의 구체적인 요청에도 불구하고 내가 자세히 설명하기 위해 첫 번째 예를 선택한 이유를 설명했습니다. 이 모든 문제를 지적 해 주셔서 감사합니다. 나는 당신의 마지막 행의 의미에 대해 확신하지 못합니다.
Antoni Parellada

그것은 단지 " 한가지 마술이있다 : 제안 된 값을 받아들이거나 거부하는 이진 결정 "; 모든 MCMC 알고리즘의 속성이 아님을 지적합니다. 그렇다고 답에 문제가 있다는 의미는 아닙니다. 원하는 경우 설명으로 간주 할 수 있습니다. 이성질체 비트가 좋았습니다.
Glen_b-복귀 모니카

1

이 Youtube 비디오 는 MCMC를 사용하여 해결 된 간단한 문제의 멋진 시각화입니다.

관심 분포는 선형 회귀 (오른쪽 위 패널)에서 가능한 기울기 및 절편에 대한 사후 분포입니다. 슬로프와 인터셉트의 일부 조합은 매우 가능성이 높습니다 (즉, 관측 된 데이터 포인트를 생성 할 가능성이 높고 사전 예상치 와 일치 함 ). 자주 샘플링해야합니다. 다른 조합은 불가능합니다 (예 : 데이터 점의 구름을 통과하지 않는 파란색 선에 해당하는 경우). 덜 자주 샘플링해야합니다.

왼쪽 하단의 큰 패널은 2 차원 공간의 경사와 가로 채기를 통해 마르코프 체인이 취하는 경로를 보여줍니다. 히스토그램은 지금까지 체인 진행의 1 차원 요약을 보여줍니다. 체인이 충분히 길어지면 경사와 절편의 가능한 값에 대한 분포의 추정치가 매우 좋습니다.

이 경우 MCMC는 과잉이지만 솔루션을 작성하기 어려운 몇 가지 문제가 있으며 직접 해결하지 않고 Markov 체인으로 가능성을 탐색하는 것이 좋습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.