HMC (Hamiltonian Monte Carlo)의 내부 작업을 이해하려고하지만 결정 론적 시간 통합을 Metropolis-Hasting 제안으로 대체 할 때 그 부분을 완전히 이해할 수 없습니다. Michael Betancourt의 Hamiltonian Monte Carlo 에 대한 훌륭한 입문 논문을 읽고 있으므로 여기에 사용 된 것과 동일한 표기법을 따릅니다.
배경
Markov Chain Monte Carlo (MCMC)의 일반적인 목표는 분포를 근사화하는 것입니다. 목표 변수 .
현대 자동차의 아이디어는 보조 "모멘텀"변수를 도입하는 것입니다 원래 변수와 함께 이는 "위치"로 모델링됩니다. 위치-모멘텀 쌍은 확장 된 위상 공간을 형성하며 해밀턴 역학에 의해 설명 될 수 있습니다. 공동 분포 미세 표준 분해의 관점에서 작성 될 수 있습니다 :
,
어디 매개 변수를 나타냅니다 주어진 에너지 수준에서 일반 집합 이라고도 합니다 . 그림은 종이의 그림 21과 22를 참조하십시오.
원래 HMC 절차는 다음 두 번의 단계로 구성됩니다.
에너지 수준 사이에서 임의의 전환을 수행하는 확률 적 단계
주어진 에너지 수준에 따라 시간 통합 (일반적으로 leapfrog 수치 통합을 통해 구현)을 수행하는 결정적 단계입니다.
이 논문에서 leapfrog (또는 symplectic integrator)에는 작은 오차가있어 수치 적 편향이 발생할 수 있다고 주장합니다. 따라서 결정적 단계로 취급하는 대신이 단계를 확률 론적으로 만들기 위해이를 Metropolis-Hasting (MH) 제안으로 전환해야하며 결과 절차는 분포에서 정확한 표본을 산출합니다.
MH 제안은 수행합니다 도약 작업의 단계와 운동량 을 뒤집 습니다. 제안서는 다음과 같은 합격 확률로 수락됩니다.
질문
내 질문은 :
1) 결정 론적 시간 적분을 MH 제안으로 바꾸는이 수정이 왜 수치 편향을 상쇄하여 생성 된 샘플이 정확히 목표 분포를 따르도록합니까?
2) 물리학 적 관점에서, 에너지는 주어진 에너지 레벨에서 보존됩니다. 그래서 우리는 해밀턴의 방정식을 사용할 수 있습니다.
.
이런 의미에서 에너지는 일반적인 세트의 모든 곳 에서 일정해야합니다. 와 같아야한다 . 수용 확률을 구성 할 수있는 에너지 차이가있는 이유는 무엇입니까?