왜 MCMC 결과에 대한 미량 그림이 필요한가


12

MCMC 방법을 사용하여 연구 논문을 읽고 있는데 대부분이 미량 플롯을 제공합니다. Monte Carlo Markov Chain에 왜 트레이스 플롯이 필요한가요? 매개 변수의 트레이스 플롯은 무엇을 나타 냅니까?

답변:


17

MCMC 알고리즘이 실행될 때 충분한 상태 변경이있는 매개 변수로 표시되는 선험 분포가 잘 조정되도록 매개 변수 추적 플롯을 작성합니다.

극단적 인 예는 우선 분포 분산을 0으로 설정하는 것입니다. 그러면 사후 모수 추정값은 절대 변경되지 않습니다. 알고리즘은 최적의 모수 추정값이 있다고 말하지만 이것이 실제로 가장 적합한 지 결정하기에 충분한 수의 모수를 확인하지 않았습니다. 선분 분포 분산을 너무 높게 설정하면 비슷한 문제가 발생합니다. 이는 새 매개 변수가 데이터와 관련이 없을 가능성이 높기 때문에 새 매개 변수로 계산 된 로그 우도는 이전 매개 변수를 사용하는 로그 우도보다 우수하지 않을 수 있습니다. 예를 들어, "true"모수가 0.5이고 초기 추정치가 2이지만 평균이 2이고 분산이 10,000 인 정규 분포에서 선택하면 1에 가까운 모수를 얻을 가능성이 없습니다 .

로그 우도 분포에서 로컬 최소값과 최대 값에 걸리지 않고 합리적인 모수 추정값을 얻을 수있을만큼 충분히 미세하게 변할 수 있도록 모수 상태를 변경할 수있는 선분 분산을 선택해야합니다. 대부분의 문헌에서는 매개 변수가 상태의 40-60 %를 변경하도록 제안합니다.

트레이스 플롯의 또 다른 이유는 번인입니다. 일반적으로 번인 기간은 플롯에서 분명합니다 (예 : 실제 모수가 1.5이고 초기 추정치가 4 인 경우 모수 추정치가 4에서 1.5로 빠르게 이동하는 것을 볼 수 있습니다. 그리고 약 1.5) "튀는". 일반적으로 n이 번을 제거하기에 충분할 정도로 충분히 큰 첫 번째 n 반복 (예 : 1000)을 제외하지만 계산에 시간이 오래 걸리거나 매개 변수 추정치가 n보다 수렴하는 데 훨씬 오래 걸리는 경우 번인을 고려하기 위해 더 많거나 적은 관측치를 생략 할 수 있습니다. 번인이 결과에 영향을 미치지 않는지 확인하기 위해 번인 기간이 끝나는 위치를 확인하기 위해 플롯을 확인할 수 있습니다.

매개 변수 포인트 추정과 관련하여 이야기하고 있습니다. 모수 분산을 추정하는 경우 적절한 상태 변경이 있는지 확인하는 것이 훨씬 중요합니다.


5
+1 그러나 다른 쪽은 공식적인 수렴 진단을 완전히 신뢰하지 않으며 수렴을 주장하기 전에 무언가를 안구하고 싶다는 것입니다. 이것은 전적으로 합리적인 여부는 또 다른 질문입니다 ...
conjugateprior

1
이 오래된 게시물을 찾아서 죄송합니다. 그러나 충분한 반복 횟수가있는 한 이전 값 (사전 분포에서 생성 된)이 관련이없는 것으로 간주되지 않습니까?
mscnvrsy

@mscnvrsy : 이전에 정보를 적게 제공하려는 경우 Jeffry의 이전 또는 균일 한 정보와 같은 비 정보적인 우선 순위를 지정할 수 있습니다.
Benzamin

3
나는 MCMC 추적 도표가 어떤 식 으로든 이전 분포를 교정하는 것과 관련이 있다는 개념에 완전히 동의하지 않습니다. MCMC 알고리즘은 이전의 선택과 무관하게 주어진 후방 분포를 목표로하며 적절한 조건에서이 고정 분포에 수렴하는 Markov 체인을 만듭니다. 미량 플롯을 보는 것은 Markov 체인의 수렴 또는 부족을 평가할 때만 유용합니다.
Xi'an
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.