MCMC 알고리즘의 오류 예


28

Markov chain Monte Carlo 방법의 자동 확인 방법을 조사 중이며 이러한 알고리즘을 구성하거나 구현할 때 발생할 수있는 실수의 예를 원합니다. 출판 된 논문에 잘못된 방법을 사용한 경우 보너스 포인트.

다른 유형의 오류 (예 : 인체 공학적 체인이 아닌)도 관심이 있지만 오류가 체인에 부정확 한 분포가 있음을 의미하는 경우에 특히 관심이 있습니다.

이러한 오류의 예는 Metropolis-Hastings가 제안 된 이동을 거부 할 때 값을 출력하지 못하는 것입니다.


7
내가 가장 좋아하는 예 중 하나 는 좋은 점근 적 특성을 가지고 있지만 실제로는 작동하지 않기 때문에 고조파 평균 추정기 입니다. Radford Neal 은 자신의 블로그에서이를 설명합니다. "나쁜 소식은이 견적자가 정답에 가까워지는 데 필요한 포인트 수가 관측 가능한 우주의 원자 수보다 많을 것입니다." 이 방법은 응용 프로그램에서 널리 구현되었습니다.

3
닐 교수의 다른 예의.
Cyan

5
@Cyan Neal을 진지하게 받아들이 기 위해서는 인터넷에 기사를 제출하기보다는 그의 논문을 받아 들일 저널을 찾았어야한다고 생각합니다. 나는 그가 옳고 심판과 저자가 틀렸다는 것을 쉽게 믿을 수 있습니다. 출판 된 결과와 모순되는 논문을 출판하기는 어렵지만 JASA 거부는 실망 스럽지만, 나는 그가 성공할 때까지 여러 다른 저널을 시도했을 것이라고 생각합니다. 결과에 신뢰성을 추가하려면 부분적이고 독립적 인 심판이 필요합니다.
Michael R. Chernick 2016 년

4
항상 닐 교수님을 진지하게 받아 들여야합니다! ; o) 진지하게 이런 결과가 출판되기 어렵다는 것은 부끄러운 일이며, 불행히도 현대의 학업 문화는 그런 종류의 것을 소중히 여기지 않는 것 같습니다. 흥미로운 질문, 나는 대답에 매우 관심이 있습니다.
Dikran Marsupial 2016

6
@ 마이클 : 아마도. Neal 교수의 입장을 포함하여 유사한 상황의 모든 측면에서 많은 경우에, 나의 일화적인 관찰은 논문 접수가 많은 경우와 마찬가지로 대부분의 경우 정보 내용이 매우 적다는 것을 보여줍니다. 동료 검토는 사람들이 인정하는 것보다 훨씬 시끄러운 순서이며, 종종 여기에서 와 같이 부분 적이고 관심있는 (즉, 독립적이지 않은) 당사자와 관심이 있습니다. 즉, 나는 지금까지의 주제를 우리에게 데려다 줄 원래의 의견을 의도하지 않았습니다. 문제에 대한 의견을 보내 주셔서 감사합니다.
추기경

답변:


11

1. 한계 가능성과 고조파 평균 추정기

한계 우도 사후 분포의 정규화 상수로 정의

p(x)=Θp(x|θ)p(θ)dθ.

이 수량의 중요성은 Bayes factor 를 통한 모델 비교 에서 중요한 역할을합니다 .

이 양을 근사하기위한 몇 가지 방법 이 제안되었습니다. Raftery et al. (2007) 은 단순성으로 인해 빠르게 인기를 얻은 고조파 평균 추정기를 제안합니다 . 아이디어는 관계를 사용하여 구성됩니다

1p(x)=Θp(θ|x)p(x|θ)dθ.

따라서 과 같은 이 이 수량은 다음과 같이 근사 할 수 있습니다.(θ1,...,θN)

1p(x)1Nj=1N1p(x|θj).

이 근사값은 중요도 샘플링 개념과 관련이 있습니다 .

Neal의 블로그 에서 논의한 바와 같이, 다수의 법칙에 따르면이 추정치는 일관성이 있습니다. 문제는 좋은 근사화에 필요한 이 클 수 있다는 것입니다. 몇 가지 예는 Neal의 블로그 또는 Robert의 블로그 1 , 2 , 3 , 4 를 참조하십시오 .N

대안

근사에 대한 많은 대안이 있습니다 . Chopin and Robert (2008) 는 몇 가지 중요도 샘플링 기반 방법을 제시합니다.p(x)

2. MCMC 샘플러를 충분히 오래 작동하지 않음 (특히 다중 모드가있는 경우)

멘 및 페나 - 레즈 (1999) 추론 전 / 후방 참조 개의 통상의 수단에 대한 비율과 실제 데이터 세트를 이용하여이 모델을 얻은 추정의 예를 제시한다. MCMC 방법을 사용하여 아래에 표시된 평균 비율의 크기가 인 표본을 얻습니다.2000φ

여기에 이미지 설명을 입력하십시오

대한 HPD 간격을 . 사후 분포의 표현을 분석 한 후, 특이점이 있고 사후가 실제로 다음과 같아야 한다는 것을 쉽게 알 수 있습니다 (단수는 )φ (0.63,5.29)00

여기에 이미지 설명을 입력하십시오

MCMC 샘플러를 충분히 오래 실행하거나 적응 형 방법을 사용하는 경우에만 감지 할 수 있습니다. 이러한 방법 중 하나를 사용하여 얻은 HPD 는 이미 보고 된 대로 입니다. HPD 간격의 길이가 크게 증가하여 길이가 빈번한 / 고전적인 방법 과 비교 될 때 중요한 의미를 갖습니다 .(0,7.25)

3. Gelman, Carlin 및 Neal 은이 논의 에서 수렴 평가, 시작 값 선택, 체인의 열악한 동작과 같은 다른 문제를 찾을 수 있습니다 .

4. 중요도 샘플링

g

I=f(x)dx=f(x)g(x)g(x)dx.

g(x1,...,xN)I

I1Nj=1Nf(xj)g(xj).

가능한 문제는 에 보다 / 무거운 꼬리가 있거나 좋은 근사화에 필요한 클 수 있다는 것입니다. R의 다음 장난감 예를 참조하십시오.gf

# Integrating a Student's t with 1 d.f. using a normal importance function   
x1 = rnorm(10000000)   # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))

# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))

2
그들은 좋은 예입니다. 관심있는 사람을 위해 그림이있는 편집자에게 보내는 편지는 다음과 같습니다. onlinelibrary.wiley.com/doi/10.1002/bimj.200800256/abstract
Simon Byrne

2
아주 좋고 명확한 요약!! (+1)
gui11aume

12

그의 블로그 에있는 대런 윌킨슨 (Darren Wilkinson) 은 랜덤 워크 메트로폴리스-해 스팅 스 (Metropolis-Hastings)에서 흔히 저지르는 실수에 대한 자세한 예를 제공합니다. 나는 그것을 완전히 읽는 것이 좋지만 여기에 tl; dr 버전이 있습니다.

목표 분포가 한 차원에서 긍정적 인 경우 (감마 분포 ) 해당 차원에서 음수 값을 갖는 제안을 즉시 거부하려고합니다. 실수는 절대로 제안을 버리지 않고 다른 것의 Metropolis-Hastings (MH) 수용 비율을 평가하는 것입니다. 이것은 대칭이 아닌 제안 밀도를 사용하기 때문에 실수입니다.

저자는 두 가지 수정 중 하나를 적용 할 것을 제안합니다.

  1. "부정적"을 수용 실패로 계산하십시오 (그리고 약간의 효율성을 잃음).

  2. 이 경우 올바른 MH 비율을 사용하십시오.

π(엑스)π(엑스)Φ(엑스)Φ(엑스),

πΦϕ Φ(엑스)=0ϕ(와이엑스)와이


1
+1 재미있는 예. 또한 수용 률과 관련된 MH의 다른 문제에 대해서도 생각하고있었습니다. 나는 생각 0.234 최적의 속도가 남용되고있다.

@Procrastinator MCMC 문헌을 잘 알고 있습니다. 이것이 당신의 전문 분야입니까?
gui11aume

귀하의 의견에 감사드립니다. 나는 베이지안 통계를 좋아한다. 그리고 나는 MCMC를 교차시켜야한다;).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.