한 가지 옵션은 Brubaker et al (1)의 묵시적으로 정의 된 매니 폴드 에 대한 MCMC 방법의 패밀리에 설명 된대로 제한된 HMC 변형을 사용하는 것 입니다. 이를 위해서는 위치 매개 변수의 최대 우도 추정치가 암묵적으로 정의 된 (및 차별화 가능한) 전체적 제약 조건 c \ left (\ lbrace x_i \ rbrace_ {i = 1} ^ 로 고정 된 \ mu_0 과 동일한 조건을 표현할 수 있어야합니다. N \ 오른쪽) = 0 . 그런 다음이 제약 조건에 따라 제한된 Hamiltonian 동적 특성을 시뮬레이션하고 표준 HMC에서와 같이 Metropolis-Hastings 단계에서 수락 / 거부 할 수 있습니다.μ0c ( { x나는}엔나는 = 1) =0
음의 로그 우도는
에 대해 1 차 및 2 차 부분 도함수가 있습니다 위치 매개 변수
최대 가능성 추정치 인 은 암시 적으로 다음에 대한 솔루션으로 정의됩니다.
μ∂L
L=−∑i=1N[logf(xi|μ)]=3∑i=1N[log(1+(xi−μ)25)]+constant
μ
μ0c=N∑i=1[2(μ0−xi)∂L∂μ=3∑i=1N[2(μ−xi)5+(μ−xi)2]and∂2L∂μ2=6∑i=1N[5−(μ−xi)2(5+(μ−xi)2)2].
μ0c=∑i=1N[2(μ0−xi)5+(μ0−xi)2]=0subject to∑i=1N[5−(μ0−xi)2(5+(μ0−xi)2)2]>0.
주어진 대해 대해 고유 한 MLE이 있음을 제안하는 결과가 있는지 확실하지 않습니다 . 밀도는 에서 로그 오목 하지 않으므로 보이지 않습니다. 이것을 보증하는 사소한. 단일 고유 솔루션이 경우 위에서 암시 연결된 정의 에 매립 차원 매니 세트에 대응 MLE 함께 같게 ~{ x i } N i = 1 μ N - 1 R N { x i } N i = 1 μ μ 0μ{xi}Ni=1μN−1RN{xi}Ni=1μμ0. 여러 솔루션이있는 경우 매니 폴드는 여러 비 연결 구성 요소로 구성 될 수 있으며이 중 일부는 우도 함수의 최소값에 해당 할 수 있습니다. 이 경우 연결되지 않은 구성 요소 사이에서 이동하기위한 몇 가지 추가 메커니즘이 필요합니다 (시뮬레이션 된 동적은 일반적으로 단일 구성 요소에 국한되어 있음). 가능성의 최소값.
우리가 사용하는 경우 벡터 나타 내기 와 공액 운동량 상태 도입 질량 매트릭스 과 라그랑주을 스칼라 제한 조건 대해 승수 를 입력 한 다음 ODE 시스템에 대한 솔루션
x[x1…xN]TpMλc(x)
dxdt=M−1p,dpdt=−∂L∂x−λ∂c∂xsubject toc(x)=0and∂c∂xM−1p=0
주어진 초기 조건 with 및 , 는 구속 매니 폴드에 구속 된 채로 유지되는 제한적인 해밀턴 역학을 정의하고, 가역적이며 해밀턴 및 매니 폴드 체적 요소를 정확하게 보존합니다. Lagrange multiplier를 해결하여 각 시간 단계에서 제약 조건을 정확하게 유지하는 SHAKE (2) 또는 RATTLE (3)과 같은 제한된 해밀턴 시스템에 대칭 적분기를 사용하는 경우 정확한 동적 순방향 이산 시간 단계 시뮬레이션 할 수 있습니다
x(0)=x0, p(0)=p0c(x0)=0∂c∂x∣∣x0M−1p0=0Lδt 만족하는 초기 제약 조건 에서 제안 된 새로운 상태 쌍 을 확률
이러한 역학 업데이트를 가우시안 한계에서 모멘 타의 부분 / 전체 리샘플링과 함께 인터리빙하면 (
x,px′,p′min{1,exp[L(x)−L(x′)+12pTM−1p−12p′TM−1p′]}.
∂c∂xM−1p=0) 그런 다음 여러 개의 연결되지 않은 구속 조건 매니 폴드 구성 요소가있을 가능성이있는 경우, 전체 MCMC 동적 은 인체 공학적이어야하며 구성 상태 샘플 은 구속 조건 매니 폴드로 제한된 목표 밀도로 분포합니다.
x
여기에서 제한된 HMC가 어떻게 수행되는지 확인하기 위해 (4)에서 설명하고 Github 에서 사용할 수있는 측 지적 통합 기 기반의 제한된 HMC 구현을 실행 했습니다 (전체 공개 : 나는 (4)의 저자이며 Github 저장소의 소유자입니다). 확률 론적 Ornstein-Uhlenbeck 단계없이 (5)에서 제안 된 '지오 데식 -BAOAB'적분기 체계의 변형을 사용한다. 필자의 경험에 따르면이 측 지적 통합 체계는 일반적으로 (1)에 사용 된 RATTLE 방식보다 조정하기가 약간 더 쉽습니다. 결과를 생성하는 IPython 노트북이 여기에 있습니다 .
I 사용 , 와 . MLE의 에 해당 하는 초기 은 Newton의 방법에 의해 발견되었습니다 (2 차 도함수를 사용하여 가능성의 최대 값을 찾았습니다). 나는 , 로 제한된 동적 을 1000 업데이트를 위해 전체 운동량 새로 고침과 함께 인터리브했습니다. 아래 그림은 3 개의 구성 요소 에 대한 결과 추적을 보여줍니다.N=3μ=1μ0=2xμ0δt=0.5L=5x
음의 로그 우도의 1 차 및 2 차 미분의 해당 값은 다음과 같습니다.
여기서 우리는 모든 샘플링 된 에 대해 최대 로그 우도에 있다는 것을 알 수 있습니다 . 개별 트레이스 플롯에서 쉽게 알 수 없지만 샘플링 된 은 포함 된 2D 비선형 매니 폴드에 있습니다. 아래 애니메이션은 샘플을 3D로 보여줍니다.xxR3
구속 조건의 해석에 따라 (4)에 설명 된대로 일부 야 코비안 계수로 목표 밀도를 조정해야 할 수도 있습니다. 특히 에서 제한되지 않은 이동을 제안 하고 수락 하여 제약 조건을 대략 유지하기 위해 ABC와 유사한 접근 방식을 사용하는 한계 와 일치하는 결과를 원할 경우 이면 대상 밀도에 . 위의 예제에서 나는이 조정을 포함하지 않았기 때문에 샘플은 원래의 목표 밀도에서 구속 매니 폴드로 제한되었습니다.ϵ→0RN|c(x)|<ϵ∂c∂xT∂c∂x−−−−−−√
참고 문헌
MA Brubaker, M. Salzmann 및 R. Urtasun. 암시 적으로 정의 된 매니 폴드에 대한 MCMC 분석법 제품군. 2012 년 제 15 회 인공 지능 통계학 국제 회의 논문집 .
http://www.cs.toronto.edu/~mbrubake/projects/AISTATS12.pdf
J.-P. Ryckaert, G. Ciccotti 및 HJ Berendsen. 제약 조건이있는 시스템의 직교 운동 방정식의 수치 적분 : n- 알칸의 분자 역학. 전산 물리학 저널 , 1977.
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.399.6868
HC 안데르센. RATTLE : 분자 역학 계산을위한 SHAKE 알고리즘의 "속도"버전. 전산 물리학 저널 , 1983.
http://www.sciencedirect.com/science/article/pii/0021999183900141
MM Graham과 AJ Storkey. 가능성이없는 모델에서 점근 적으로 정확한 추론. arXiv 사전 인쇄 arXiv : 1605.07826v3 , 2016.
https://arxiv.org/abs/1605.07826
B. Leimkuhler와 C. Matthews. 측 지적 통합과 용매-용질 분리를 사용한 효율적인 분자 역학. Proc. R. Soc. A. Vol. 472. No. 2189. The Royal Society , 2016.
http://rspa.royalsocietypublishing.org/content/472/2189/20160138.abstract