주어진 MLE로 무작위 샘플 시뮬레이션

고정 합을 갖는 조건부 샘플을 시뮬레이션하는 질문에 대한이 Cross Validated 질문 은 George Casella 가 저에게 설정 한 문제를 상기 시켰습니다 .

파라 메트릭 모델 와이 모델의 iid 샘플 인 이 주어지면 의 MLE은 주어진 값에 대해 iid 샘플을 시뮬레이션하는 일반적인 방법이 MLE 의 값에 조건부 ? $f(x|\theta)$ $(X_1,\ldots,X_n)$ $\theta$
$\hat{θ} (x_{1}, \dots, x_{n}) = \arg min \sum_{i = 1}^{n} \log f (x_{i} | θ)$ $\hat{\theta}(x_1,\ldots,x_n)=\arg\min \sum_{i=1}^n \log f(x_i|\theta)$ $\theta$ $(X_1,\ldots,X_n)$ $\hat{\theta}(X_1,\ldots,X_n)$

예를 들어 밀도가 위치 밀도가 인 $\mathfrak{T}_5$ 분포를 사용하십시오. If 조건부로 어떻게 시뮬레이션 할 수 있습니까? 이 예에서 에는 닫힌 양식 표현식이 없습니다. $\mu$

f (x | μ) = \frac{Γ (3)}{Γ (1 / 2) Γ (5 / 2)} {[1 + (x - μ)^{2} / 5]}^{- 3}

$f(x|\mu)=\dfrac{\Gamma(3)}{\Gamma(1/2)\Gamma(5/2)}\,\left[1+(x-\mu)^2/5\right]^{-3}$

(X_{1}, \dots, X_{n}) \overset{iid}{\sim} f (x | μ)

$(X_1,\ldots,X_n)\stackrel{\text{iid}}{\sim} f(x|\mu)$

(X_{1}, \dots, X_{n})

$(X_1,\ldots,X_n)$

\hat{μ} (X_{1}, \dots, X_{n}) = μ_{0}

$\hat{\mu}(X_1,\ldots,X_n)=\mu_0$

T_{5}

$\mathfrak{T}_5$

\hat{μ} (X_{1}, \dots, X_{n})

$\hat{\mu}(X_1,\ldots,X_n)$

— 시안
소스

한 가지 옵션은 Brubaker et al (1)의 묵시적으로 정의 된 매니 폴드 에 대한 MCMC 방법의 패밀리에 설명 된대로 제한된 HMC 변형을 사용하는 것 입니다. 이를 위해서는 위치 매개 변수의 최대 우도 추정치가 암묵적으로 정의 된 (및 차별화 가능한) 제약 조건 로 고정 된 과 동일한 조건을 표현할 수 있어야합니다. . 그런 다음이 제약 조건에 따라 제한된 Hamiltonian 동적 특성을 시뮬레이션하고 표준 HMC에서와 같이 Metropolis-Hastings 단계에서 수락 / 거부 할 수 있습니다. $\mu_0$ $c\left(\lbrace x_i \rbrace_{i=1}^N\right) = 0$

음의 로그 우도는 에 대해 1 차 및 2 차 부분 도함수가 있습니다 위치 매개 변수 최대 가능성 추정치 인 은 암시 적으로 다음에 대한 솔루션으로 정의됩니다.

L = - \sum_{i = 1}^{N} [\log f (x_{i} | μ)] = 3 \sum_{i = 1}^{N} [\log (1 + \frac{(x_{i} - μ)^{2}}{5})] + constant

$\mathcal{L} = -\sum_{i=1}^N \left[ \log f(x_i \,|\, \mu) \right] = 3 \sum_{i=1}^N \left[ \log\left(1 + \frac{(x_i - \mu)^2}{5}\right)\right] + \text{constant}$

μ

$\mu$

\frac{\partial L}{\partial μ} = 3 \sum_{i = 1}^{N} [\frac{2 (μ - x_{i})}{5 + (μ - x_{i})^{2}}] and \frac{\partial^{2} L}{\partial μ^{2}} = 6 \sum_{i = 1}^{N} [\frac{5 - (μ - x_{i})^{2}}{{(5 + (μ - x_{i})^{2})}^{2}}] .

$\frac{\partial \mathcal{L}}{\partial \mu} = 3 \sum_{i=1}^N \left[ \frac{2(\mu - x_i)}{5 + (\mu - x_i)^2}\right] \quad\text{and}\quad \frac{\partial^2 \mathcal{L}}{\partial \mu^2} = 6 \sum_{i=1}^N \left[\frac{5 - (\mu - x_i)^2}{\left(5 + (\mu - x_i)^2\right)^2}\right].$

μ_{0}

$\mu_0$

c = \sum_{i = 1}^{N} [\frac{2 (μ_{0} - x_{i})}{5 + (μ_{0} - x_{i})^{2}}] = 0 subject to \sum_{i = 1}^{N} [\frac{5 - (μ_{0} - x_{i})^{2}}{{(5 + (μ_{0} - x_{i})^{2})}^{2}}] > 0.

$c = \sum_{i=1}^N \left[ \frac{2(\mu_0 - x_i)}{5 + (\mu_0 - x_i)^2}\right] = 0 \quad\text{subject to}\quad \sum_{i=1}^N \left[\frac{5 - (\mu_0 - x_i)^2}{\left(5 + (\mu_0 - x_i)^2\right)^2}\right] > 0.$

주어진 대해 대해 고유 한 MLE이 있음을 제안하는 결과가 있는지 확실하지 않습니다 . 밀도는 에서 로그 오목 하지 않으므로 보이지 않습니다. 이것을 보증하는 사소한. 단일 고유 솔루션이 경우 위에서 암시 연결된 정의 에 매립 차원 매니 세트에 대응 MLE 함께 같게 ~ $\mu$ $\lbrace x_i \rbrace_{i=1}^N$ $\mu$ $N - 1$ $\mathbb{R}^N$ $\lbrace x_i \rbrace_{i=1}^N$ $\mu$ $\mu_0$ . 여러 솔루션이있는 경우 매니 폴드는 여러 비 연결 구성 요소로 구성 될 수 있으며이 중 일부는 우도 함수의 최소값에 해당 할 수 있습니다. 이 경우 연결되지 않은 구성 요소 사이에서 이동하기위한 몇 가지 추가 메커니즘이 필요합니다 (시뮬레이션 된 동적은 일반적으로 단일 구성 요소에 국한되어 있음). 가능성의 최소값.

우리가 사용하는 경우 벡터 나타 내기 와 공액 운동량 상태 도입 질량 매트릭스 과 라그랑주을 스칼라 제한 조건 대해 승수 를 입력 한 다음 ODE 시스템에 대한 솔루션 $\boldsymbol{x}$ $\left[ x_1 \dots x_N\right]^{\rm T}$ $\boldsymbol{p}$ $\mathbf{M}$ $\lambda$ $c(\boldsymbol{x})$

\frac{d x}{d t} = M^{- 1} p, \frac{d p}{d t} = - \frac{\partial L}{\partial x} - λ \frac{\partial c}{\partial x} subject to c (x) = 0 and \frac{\partial c}{\partial x} M^{- 1} p = 0

$\frac{{\rm d}\boldsymbol{x}}{{\rm d}t} = \mathbf{M}^{-1}\boldsymbol{p}, \quad \frac{{\rm d}\boldsymbol{p}}{{\rm d}t} = -\frac{\partial \mathcal{L}}{\partial \mathbf{x}} - \lambda \frac{\partial c}{\partial \boldsymbol{x}} \quad\text{subject to}\quad c(\boldsymbol{x}) = 0 \quad\text{and}\quad \frac{\partial c}{\partial \boldsymbol{x}}\mathbf{M}^{-1}\boldsymbol{p} = 0$ 주어진 초기 조건 with 및 , 는 구속 매니 폴드에 구속 된 채로 유지되는 제한적인 해밀턴 역학을 정의하고, 가역적이며 해밀턴 및 매니 폴드 체적 요소를 정확하게 보존합니다. Lagrange multiplier를 해결하여 각 시간 단계에서 제약 조건을 정확하게 유지하는 SHAKE (2) 또는 RATTLE (3)과 같은 제한된 해밀턴 시스템에 대칭 적분기를 사용하는 경우 정확한 동적 순방향 이산 시간 단계 시뮬레이션 할 수 있습니다

x (0) = x_{0}, p (0) = p_{0}

$\boldsymbol{x}(0) = \boldsymbol{x}_0,~\boldsymbol{p}(0) = \boldsymbol{p}_0$

c (x_{0}) = 0

$c(\boldsymbol{x}_0) = 0$

{\frac{\partial c}{\partial x} |}_{x_{0}} M^{- 1} p_{0} = 0

$\left.\frac{\partial c}{\partial \boldsymbol{x}}\right|_{\boldsymbol{x}_0}\,\mathbf{M}^{-1}\boldsymbol{p}_0 = 0$

L

$L$

δ t

$\delta t$ 만족하는 초기 제약 조건 에서 제안 된 새로운 상태 쌍 을 확률 이러한 역학 업데이트를 가우시안 한계에서 모멘 타의 부분 / 전체 리샘플링과 함께 인터리빙하면 (

x, p

$\boldsymbol{x},\,\boldsymbol{p}$

x^{'}, p^{'}

$\boldsymbol{x}',\,\boldsymbol{p}'$

min {1, \exp [L (x) - L (x^{'}) + \frac{1}{2} p^{T} M^{- 1} p - \frac{1}{2} p^{' T} M^{- 1} p^{'}]} .

$\min\left\lbrace 1, \,\exp\left[ \mathcal{L}(\boldsymbol{x}) - \mathcal{L}(\boldsymbol{x}') + \frac{1}{2}\boldsymbol{p}^{\rm T}\mathbf{M}^{-1}\boldsymbol{p} - \frac{1}{2}\boldsymbol{p}'^{\rm T}\mathbf{M}^{-1}\boldsymbol{p}'\right] \right\rbrace.$

\frac{\partial c}{\partial x} M^{- 1} p = 0

$\frac{\partial c}{\partial \boldsymbol{x}}\mathbf{M}^{-1}\boldsymbol{p} = 0$ ) 그런 다음 여러 개의 연결되지 않은 구속 조건 매니 폴드 구성 요소가있을 가능성이있는 경우, 전체 MCMC 동적 은 인체 공학적이어야하며 구성 상태 샘플 은 구속 조건 매니 폴드로 제한된 목표 밀도로 분포합니다.

x

$\boldsymbol{x}$

여기에서 제한된 HMC가 어떻게 수행되는지 확인하기 위해 (4)에서 설명하고 Github 에서 사용할 수있는 측 지적 통합 기 기반의 제한된 HMC 구현을 실행 했습니다 (전체 공개 : 나는 (4)의 저자이며 Github 저장소의 소유자입니다). 확률 론적 Ornstein-Uhlenbeck 단계없이 (5)에서 제안 된 '지오 데식 -BAOAB'적분기 체계의 변형을 사용한다. 필자의 경험에 따르면이 측 지적 통합 체계는 일반적으로 (1)에 사용 된 RATTLE 방식보다 조정하기가 약간 더 쉽습니다. 결과를 생성하는 IPython 노트북이 여기에 있습니다 .

I 사용 , 와 . MLE의 에 해당 하는 초기 은 Newton의 방법에 의해 발견되었습니다 (2 차 도함수를 사용하여 가능성의 최대 값을 찾았습니다). 나는 , 로 제한된 동적 을 1000 업데이트를 위해 전체 운동량 새로 고침과 함께 인터리브했습니다. 아래 그림은 3 개의 구성 요소 에 대한 결과 추적을 보여줍니다. $N=3$ $\mu=1$ $\mu_0=2$ $\boldsymbol{x}$ $\mu_0$ $\delta t = 0.5$ $L=5$ $\boldsymbol{x}$

3D 예제의 트레이스 플롯

음의 로그 우도의 1 차 및 2 차 미분의 해당 값은 다음과 같습니다.

로그 우도 미분 트레이스 플롯

여기서 우리는 모든 샘플링 된 에 대해 최대 로그 우도에 있다는 것을 알 수 있습니다 . 개별 트레이스 플롯에서 쉽게 알 수 없지만 샘플링 된 은 포함 된 2D 비선형 매니 폴드에 있습니다. 아래 애니메이션은 샘플을 3D로 보여줍니다. $\boldsymbol{x}$ $\boldsymbol{x}$ $\mathbb{R}^3$

2D 매니 폴드에 한정된 샘플의 3D 시각화

구속 조건의 해석에 따라 (4)에 설명 된대로 일부 야 코비안 계수로 목표 밀도를 조정해야 할 수도 있습니다. 특히 에서 제한되지 않은 이동을 제안 하고 수락 하여 제약 조건을 대략 유지하기 위해 ABC와 유사한 접근 방식을 사용하는 한계 와 일치하는 결과를 원할 경우 이면 대상 밀도에 . 위의 예제에서 나는이 조정을 포함하지 않았기 때문에 샘플은 원래의 목표 밀도에서 구속 매니 폴드로 제한되었습니다. $\epsilon \to 0$ $\mathbb{R}^N$ $|c(\boldsymbol{x})| < \epsilon$ $\sqrt{\frac{\partial c}{\partial \boldsymbol{x}}^{\rm \scriptscriptstyle T}\frac{\partial c}{\partial \boldsymbol{x}}}$

참고 문헌

MA Brubaker, M. Salzmann 및 R. Urtasun. 암시 적으로 정의 된 매니 폴드에 대한 MCMC 분석법 제품군. 2012 년 제 15 회 인공 지능 통계학 국제 회의 논문집 .
http://www.cs.toronto.edu/~mbrubake/projects/AISTATS12.pdf
J.-P. Ryckaert, G. Ciccotti 및 HJ Berendsen. 제약 조건이있는 시스템의 직교 운동 방정식의 수치 적분 : n- 알칸의 분자 역학. 전산 물리학 저널 , 1977.
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.399.6868
HC 안데르센. RATTLE : 분자 역학 계산을위한 SHAKE 알고리즘의 "속도"버전. 전산 물리학 저널 , 1983.
http://www.sciencedirect.com/science/article/pii/0021999183900141
MM Graham과 AJ Storkey. 가능성이없는 모델에서 점근 적으로 정확한 추론. arXiv 사전 인쇄 arXiv : 1605.07826v3 , 2016.
https://arxiv.org/abs/1605.07826
B. Leimkuhler와 C. Matthews. 측 지적 통합과 용매-용질 분리를 사용한 효율적인 분자 역학. Proc. R. Soc. A. Vol. 472. No. 2189. The Royal Society , 2016.
http://rspa.royalsocietypublishing.org/content/472/2189/20160138.abstract

— 맷 그레이엄
소스

밝고 새롭고 밝은 관점! 감사합니다.

— 시안