MCMC 방법-샘플 굽기?

12

에서 MCMC의 방법, 나는에 대해 계속 읽기 burn-in시간이나, 샘플의 수 "burn". 이것이 정확히 무엇이며 왜 필요한가요?

최신 정보:

MCMC가 안정화되면 안정적으로 유지됩니까? burn-in시간 의 개념 은 혼합 시간 의 개념과 어떤 관련이 있습니까?

sampling mcmc

1

' 번인 (burn-in) ' 이라는 문구 는 샘플을 '버닝 (burning)'하는 것을 의미하지 않지만, 시스템이 "새로운"상태에서 사용하기에 적합한 상태로 만족스럽게 정착하게합니다. (샘플은 예에 정착하는 동안 폐기되지만 구절은 그런 의미에서 '굽기'의미하지는 않습니다. 도로를 복용하기 전에 '엔진을 워밍업'에의 가까이를.)를 참조하십시오 이 답변을 몇 가지 논의 무엇을 위해.

— Glen_b-복지 주 모니카

(특히 답의 첫 번째 단락)

— Glen_b -Reinstate Monica

1

@ Glen_b, 나는 그것을 알고 있었다고 생각하지만, 연기가 나고 모호한 샘플의 정신적 이미지를 좋아합니다 ....

— Matt Krause

17

번인은 Markov Chain이 평형 분포에 도달 할 수있는 시간, 특히 시끄러운 출발점에서 시작한 시간을 제공하기위한 것입니다. 체인을 "번인 (burn in)"하려면 점 수집을 시작하기 전에 처음 샘플 만 버립니다 . $n$

아이디어는 "나쁜"시작점이 평형 분포에 도달하기 전에 평형 분포 하에서 실제로 매우 낮은 확률을 갖는 영역을 과표 본 할 수 있다는 것입니다. 당신이 그 점들을 버린다면, 아마 드물게 될 것 같은 점들은 거의 없을 것입니다.

이 페이지 는 좋은 예를 제공하지만 번인 (burn-in)은 기본 기술보다 해킹 / 아트에 가깝습니다. 이론적으로, 당신은 정말 오랫동안 샘플링하거나 대신 적절한 출발점을 선택할 수있는 방법을 찾을 수 있습니다.

편집 : 믹싱 시간은 체인이 정상 상태에 도달하는 데 걸리는 시간을 의미하지만 직접 계산하기는 종종 어렵습니다. 혼합 시간을 알고 있다면, 그 많은 샘플을 버릴 것입니다. 그러나 많은 경우에는 그렇지 않습니다. 따라서 희망 시간보다 큰 번인 시간을 선택하십시오.

안정성에 달려 있습니다. 체인이 수렴되면 ... 수렴됩니다. 체인이 어디 그러나, 상황도 있습니다 나타납니다 단지 상태 공간의 한 부분에서 "놀고"있는 사실 수렴 할 수 있지만. 예를 들어, 여러 모드가 있지만 각 모드가 다른 모드와 제대로 연결되어 있지 않다고 가정하십시오. 샘플러가 그 갭을 가로 지르는 데 시간이 오래 걸리고 체인이 점프 할 때까지 수렴 된 것처럼 보일 것입니다.

수렴에 대한 진단이 있지만 많은 수의 사람들이 진정한 수렴과 의사 수렴을 구별하는 데 어려움을 겪고 있습니다. Markov Chain Handbook의 Charles Geyer 's 챕터 (# 1) Monte Carlo 는 가능한 한 오랫동안 체인을 운영하지만 모든 것에 대해 비관적입니다.

— 맷 크라우스
소스

감사. 개념을 더 명확하게 설명하기 위해 OP에 작은 업데이트를 추가했습니다.

— Amelio Vazquez-Reina

조금 더 추가했습니다. 도움이 되길 바랍니다.

— 매트 크라우스

6

Metropolis-Hastings 알고리즘은 사후 분포에서 무작위로 샘플링합니다. 일반적으로, Markov Chain이 정지 분포로 안정화되지 않았기 때문에 초기 샘플이 완전히 유효하지 않습니다. 샘플의 번을 사용하면 아직 고정되지 않은 초기 샘플을 폐기 할 수 있습니다.

— 에릭 피터슨
소스

1

감사합니다-Markov 체인이 안정화되면 안정적으로 유지됩니까? 이것은 혼합 시간의 개념과 어떤 관련이 있습니까? 같은가요?

— Amelio Vazquez-Reina