주어진 MLE로 무작위 샘플 시뮬레이션


17

고정 합을 갖는 조건부 샘플을 시뮬레이션하는 질문에 대한이 Cross Validated 질문 은 George Casella 가 저에게 설정 한 문제를 상기 시켰습니다 .

파라 메트릭 모델 와이 모델의 iid 샘플 인 이 주어지면 의 MLE은 주어진 값에 대해 iid 샘플을 시뮬레이션하는 일반적인 방법이 있습니까 (X_1, \ ldots, X_n) MLE \ hat {\ theta} (X_1, \ ldots, X_n) 의 값에 조건부 ?f(x|θ)(X1,,Xn)θ ( X 1 , ... , X의 N ) = ARG N Σ= 1 로그 F를 ( X I | θ ) θ ( X 1 , ... , X N ) θ ( X 1 , ... ,θ

θ^(x1,,xn)=argmini=1nlogf(xi|θ)
θ(X1,,Xn)θ^(X1,,Xn)

예를 들어 밀도가 f (x | \ mu) = \ dfrac {\ Gamma (3)} {\ Gamma (1/2) \ Gamma ( 위치 밀도가 \ muT5 분포를 사용하십시오. 5/2)} \, \ left [1+ (x- \ mu) ^ 2 / 5 \ right] ^ {-3} If (X_1, \ ldots, X_n) \ stackrel {\ text {iid}} {\ sim} f (x | \ mu) \ hat {\ mu} (X_1, \ ldots, X_n) = \ mu_0에서 조건부로 (X_1, \ ldots, X_n )을 어떻게 시뮬레이션 할 수 있습니까? 이 \ mathfrak {T} _5 예에서 \ hat {\ mu} (X_1, \ ldots, X_n) 분포 에는 닫힌 양식 표현식이 없습니다.μ

f(x|μ)=Γ(3)Γ(1/2)Γ(5/2)[1+(xμ)2/5]3
(X1,,Xn)iidf(x|μ)
(엑스1,,엑스)μ^(엑스1,,엑스)=μ05μ^(엑스1,,엑스)

답변:


20

한 가지 옵션은 Brubaker et al (1)의 묵시적으로 정의 된 매니 폴드대한 MCMC 방법의 패밀리에 설명 된대로 제한된 HMC 변형을 사용하는 것 입니다. 이를 위해서는 위치 매개 변수의 최대 우도 추정치가 암묵적으로 정의 된 (및 차별화 가능한) 전체적 제약 조건 c \ left (\ lbrace x_i \ rbrace_ {i = 1} ^ 로 고정 된 \ mu_0 과 동일한 조건을 표현할 수 있어야합니다. N \ 오른쪽) = 0 . 그런 다음이 제약 조건에 따라 제한된 Hamiltonian 동적 특성을 시뮬레이션하고 표준 HMC에서와 같이 Metropolis-Hastings 단계에서 수락 / 거부 할 수 있습니다.μ0({엑스나는}나는=1)=0

음의 로그 우도는 에 대해 1 차 및 2 차 부분 도함수가 있습니다 위치 매개 변수 최대 가능성 추정치 인 은 암시 적으로 다음에 대한 솔루션으로 정의됩니다. μL

L=i=1N[logf(xi|μ)]=3i=1N[log(1+(xiμ)25)]+constant
μ μ0c=Ni=1[2(μ0xi)
Lμ=3i=1N[2(μxi)5+(μxi)2]and2Lμ2=6i=1N[5(μxi)2(5+(μxi)2)2].
μ0
c=i=1N[2(μ0xi)5+(μ0xi)2]=0subject toi=1N[5(μ0xi)2(5+(μ0xi)2)2]>0.

주어진 대해 대해 고유 한 MLE이 있음을 제안하는 결과가 있는지 확실하지 않습니다 . 밀도는 에서 로그 오목 하지 않으므로 보이지 않습니다. 이것을 보증하는 사소한. 단일 고유 솔루션이 경우 위에서 암시 연결된 정의 에 매립 차원 매니 세트에 대응 MLE 함께 같게 ~{ x i } N i = 1 μ N - 1 R N { x i } N i = 1 μ μ 0μ{xi}i=1NμN1RN{xi}i=1Nμμ0. 여러 솔루션이있는 경우 매니 폴드는 여러 비 연결 구성 요소로 구성 될 수 있으며이 중 일부는 우도 함수의 최소값에 해당 할 수 있습니다. 이 경우 연결되지 않은 구성 요소 사이에서 이동하기위한 몇 가지 추가 메커니즘이 필요합니다 (시뮬레이션 된 동적은 일반적으로 단일 구성 요소에 국한되어 있음). 가능성의 최소값.

우리가 사용하는 경우 벡터 나타 내기 와 공액 운동량 상태 도입 질량 매트릭스 과 라그랑주을 스칼라 제한 조건 대해 승수 를 입력 한 다음 ODE 시스템에 대한 솔루션 x[x1xN]TpMλc(x)

dxdt=M1p,dpdt=Lxλcxsubject toc(x)=0andcxM1p=0
주어진 초기 조건 with 및 , 는 구속 매니 폴드에 구속 된 채로 유지되는 제한적인 해밀턴 역학을 정의하고, 가역적이며 해밀턴 및 매니 폴드 체적 요소를 정확하게 보존합니다. Lagrange multiplier를 해결하여 각 시간 단계에서 제약 조건을 정확하게 유지하는 SHAKE (2) 또는 RATTLE (3)과 같은 제한된 해밀턴 시스템에 대칭 적분기를 사용하는 경우 정확한 동적 순방향 이산 시간 단계 시뮬레이션 할 수 있습니다x(0)=x0, p(0)=p0c(x0)=0cx|x0M1p0=0Lδt 만족하는 초기 제약 조건 에서 제안 된 새로운 상태 쌍 을 확률 이러한 역학 업데이트를 가우시안 한계에서 모멘 타의 부분 / 전체 리샘플링과 함께 인터리빙하면 (x,px,p
min{1,exp[L(x)L(x)+12pTM1p12pTM1p]}.
cxM1p=0) 그런 다음 여러 개의 연결되지 않은 구속 조건 매니 폴드 구성 요소가있을 가능성이있는 경우, 전체 MCMC 동적 은 인체 공학적이어야하며 구성 상태 샘플 은 구속 조건 매니 폴드로 제한된 목표 밀도로 분포합니다.x

여기에서 제한된 HMC가 어떻게 수행되는지 확인하기 위해 (4)에서 설명하고 Github 에서 사용할 수있는 측 지적 통합 기 기반의 제한된 HMC 구현을 실행 했습니다 (전체 공개 : 나는 (4)의 저자이며 Github 저장소의 소유자입니다). 확률 론적 Ornstein-Uhlenbeck 단계없이 (5)에서 제안 된 '지오 데식 -BAOAB'적분기 체계의 변형을 사용한다. 필자의 경험에 따르면이 측 지적 통합 체계는 일반적으로 (1)에 사용 된 RATTLE 방식보다 조정하기가 약간 더 쉽습니다. 결과를 생성하는 IPython 노트북이 여기에 있습니다 .

I 사용 , 와 . MLE의 에 해당 하는 초기 은 Newton의 방법에 의해 발견되었습니다 (2 차 도함수를 사용하여 가능성의 최대 값을 찾았습니다). 나는 , 로 제한된 동적 을 1000 업데이트를 위해 전체 운동량 새로 고침과 함께 인터리브했습니다. 아래 그림은 3 개의 구성 요소 에 대한 결과 추적을 보여줍니다.N=3μ=1μ0=2xμ0δt=0.5L=5x

3D 예제의 트레이스 플롯

음의 로그 우도의 1 차 및 2 차 미분의 해당 값은 다음과 같습니다.

로그 우도 미분 트레이스 플롯

여기서 우리는 모든 샘플링 된 에 대해 최대 로그 우도에 있다는 것을 알 수 있습니다 . 개별 트레이스 플롯에서 쉽게 알 수 없지만 샘플링 된 은 포함 된 2D 비선형 매니 폴드에 있습니다. 아래 애니메이션은 샘플을 3D로 보여줍니다.xxR3

2D 매니 폴드에 한정된 샘플의 3D 시각화

구속 조건의 해석에 따라 (4)에 설명 된대로 일부 야 코비안 계수로 목표 밀도를 조정해야 할 수도 있습니다. 특히 에서 제한되지 않은 이동을 제안 하고 수락 하여 제약 조건을 대략 유지하기 위해 ABC와 유사한 접근 방식을 사용하는 한계 와 일치하는 결과를 원할 경우 이면 대상 밀도에 . 위의 예제에서 나는이 조정을 포함하지 않았기 때문에 샘플은 원래의 목표 밀도에서 구속 매니 폴드로 제한되었습니다.ϵ0RN|c(x)|<ϵcxTcx

참고 문헌

  1. MA Brubaker, M. Salzmann 및 R. Urtasun. 암시 적으로 정의 된 매니 폴드에 대한 MCMC 분석법 제품군. 2012 년 제 15 회 인공 지능 통계학 국제 회의 논문집 .
    http://www.cs.toronto.edu/~mbrubake/projects/AISTATS12.pdf

  2. J.-P. Ryckaert, G. Ciccotti 및 HJ Berendsen. 제약 조건이있는 시스템의 직교 운동 방정식의 수치 적분 : n- 알칸의 분자 역학. 전산 물리학 저널 , 1977.
    http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.399.6868

  3. HC 안데르센. RATTLE : 분자 역학 계산을위한 SHAKE 알고리즘의 "속도"버전. 전산 물리학 저널 , 1983.
    http://www.sciencedirect.com/science/article/pii/0021999183900141

  4. MM Graham과 AJ Storkey. 가능성이없는 모델에서 점근 적으로 정확한 추론. arXiv 사전 인쇄 arXiv : 1605.07826v3 , 2016.
    https://arxiv.org/abs/1605.07826

  5. B. Leimkuhler와 C. Matthews. 측 지적 통합과 용매-용질 분리를 사용한 효율적인 분자 역학. Proc. R. Soc. A. Vol. 472. No. 2189. The Royal Society , 2016.
    http://rspa.royalsocietypublishing.org/content/472/2189/20160138.abstract


3
밝고 새롭고 밝은 관점! 감사합니다.
시안
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.