해밀턴 몬테카를로와 이산 파라미터 공간


13

나는 방금 스탠 에서 모델을 만들기 시작했다 . 이 도구에 익숙해지기 위해 Bayesian Data Analysis (2nd ed.)의 일부 연습을 진행하고 있습니다. Waterbuck 운동 전제로하는 데이터 와, ( N , θ ) 알 수 없습니다. Hamiltonian Monte Carlo는 이산 파라미터를 허용하지 않기 때문에 N 을 실수 [ 72 , ) 로 선언 하고 함수를 사용하여 실제 이항 분포를 코딩했습니다 .nbinomial(N,θ)(N,θ)N[72,)lbeta

결과의 히스토그램은 사후 밀도를 직접 계산하여 찾은 것과 거의 동일하게 보입니다. 그러나 나는 이러한 결과를 일반적으로 믿지 말아야 할 미묘한 이유가 있을지 모른다는 우려가있다. 에 대한 실제 값 추론은 정수가 아닌 값에 양의 확률을 할당하기 때문에 분수 워터 벅이 실제로 존재하지 않기 때문에 이러한 값은 불가능하다는 것을 알고 있습니다. 반면에 결과는 양호 해 보이므로 단순화는이 경우 추론에 영향을 미치지 않는 것으로 보입니다.N

이런 식으로 모델링을위한 지침 원칙이나 경험 규칙이 있습니까? 아니면이 방법이 불연속 매개 변수를 실제 나쁜 습관으로 "승격시키는"방법입니까?


3
N72NθN

θ^

답변:


18

먼저 사용자 구현 목록 ( http://mc-stan.org/mailing-lists.html )에서 Stan 구현 / 최적화 / 등과 관련된 문제뿐만 아니라 실제 통계 및 모델링 질문.

귀하의 질문에 관해서는, 그것은 절대적으로 훌륭한 접근법입니다. 더 엄격하게 정당화하는 방법은 여러 가지가 있지만 (예를 들어, 이산 CDF와 연속 근사값의 차이를 살펴 보는 경우), 기본적으로 분산이 몇 배보다 큰 경우에는 누락 된 이산화가 실제로는 없습니다. 후속 추론에 대한 영향.

이러한 종류의 근사법은 어디에나 있으며, 일반적인 예는 독립 포아송 분포의 곱으로서 다항 분포를 근사한 다음 가우시안 분포로 근사합니다.


9
년 후, 당신은 실현, 그 순간 마이클 베탕 쿠르가 질문에 대한 답변을 게시는 ...
Sycorax는 분석 재개 모니카 말한다
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.