ABC와 MCMC의 응용 프로그램은 어떻게 다릅니 까?


15

대략적인 베이지안 계산 (ABC)과 마르코프 체인 몬테 카를로 (MCMC)는 비슷한 목표를 가지고 있습니다. 아래에서는 이러한 방법에 대한 이해와 실제 데이터에 대한 응용 프로그램의 차이점을 어떻게 인식하는지 설명합니다.

대략적인 베이지안 계산

ABC는 수치 시뮬레이션을 통해 관측 된 와 비교되는 통계 를 계산하여 이전 의 매개 변수 를 샘플링하는 것으로 구성됩니다 . 거부 알고리즘에 따라 는 유지되거나 거부됩니다. 유지 된 목록은 사후 분포를 만들었습니다.x i x o b s x i x iθ엑스나는엑스영형에스엑스나는엑스나는

마르코프 체인 몬테 카를로

MCMC는 매개 변수의 사전 분포를 샘플링하는 것으로 구성됩니다 . 그것은 첫 번째 샘플 소요 , 연산 다음 새 값으로 점프 (일부 규칙에 따라) 하는 가 다시 계산됩니다. 비 으로 계산 어떤 임계 값에 의존한다, 다음 점프 첫 번째 또는 두 번째 위치에서 발생합니다. 값 의 탐색 은 1과 1로 진행되며 결국 값의 분포는 사후 분포θ 1 P ( x o b s | θ 1 ) P ( θ 1 ) θ 2 P ( x o b s | θ 2 ) P ( θ 2 ) P ( x o b s | θ 2 ) P ( θ 2 )θθ1(엑스영형에스|θ1)(θ1)θ2(엑스영형에스|θ2)(θ2)(엑스영형에스|θ2)(θ2)(엑스영형에스|θ1)(θ1)θθ(θ|엑스) (아직 나에게 알려지지 않은 이유로).

나는 나의 설명이이 용어들 각각에 존재하는 다양한 방법들 (특히 MCMC)을 대표하는 것을 놓친다는 것을 알고있다.

ABC 대 MCMC (장단점)

ABC는 를 분석적으로 해결할 필요가 없다는 장점이 있습니다 . 따라서 ABC는 MCMC가 만들지 않는 복잡한 모델에 편리합니다.(엑스|θ)(θ)

MCMC를 사용하면 통계 테스트 (우도 비율 테스트, G- 테스트 등)를 수행 할 수 있지만 ABC에서는 이것이 가능하지 않다고 생각합니다.

지금까지 내가 있습니까?

질문

  • ABC와 MCMC의 응용 프로그램은 어떻게 다릅니 까? 하나 또는 다른 방법을 어떻게 사용하기로 결정합니까?

1
"MCMC는 매개 변수 θ의 사전 분포를 샘플링하는 것으로 구성됩니다." 확실히 할 수는 있지만 대부분의 경우 바람직하지도 않습니다. 많은 MCMC 애플리케이션의 경우 θ1을 중심으로 한 후보 분포 (예 : 표준 편차가 작은 가우스)에서 θ2를 샘플링 한 다음 위에서 언급 한대로 수락 / 거부 비율을 계산합니다. 이것은 ABC와 대조적이며, 여기서는 이전의 샘플을 추출합니다 (이는 일반적으로 ABC에 사전 정보를 통합하는 유일한 방법입니다).
z_dood

답변:


12

Björn의 답변에 대한 추가 의견 :

  1. ABC는 계산 목적이 아니라 베이지안 추론의 본질에 대한 설명으로 Rubin (1984)에 의해 처음 소개되었습니다. 이 논문에서 그는 표본 분포와 이전 분포가 상호 작용하여 후방 분포를 만드는 방법을 설명했습니다.

  2. 그러나 ABC는 주로 계산상의 이유로 이용됩니다. 인구 유전 학자들은 관찰 된 샘플의 가능성을 감수 할 수없는 나무 기반 모델에 대한 방법을 고안했다. 이러한 설정에서 사용할 수있는 MCMC (Data Augmentation) 체계는 매우 비효율적이며 단일 차원의 매개 변수를 사용하더라도 중요도 샘플링이 중요했습니다. ABC는 MCMC 또는 PMC와 같은 Monte Carlo 방법을 대체합니다. 모든 실용적 목적으로 사용 가능한 것은 아닙니다. 사용 가능한 경우 ABC는 더 빨리 실행되는 경우이를 교정하는 데 사용할 수있는 프록시로 나타납니다.

  3. 좀 더 현대적인 관점에서 저는 개인적으로 ABC를 계산 기술이 아닌 대략적인 추론 방법으로 생각합니다. 근사 모델을 구축함으로써, 정확한 모델에 의존하지 않고도 관심 파라미터에 대한 추론을 도출 할 수 있습니다. 이 설정에서는 어느 정도의 유효성 검사가 필요하지만 모델 평균화 또는 비모수를 수행하는 것보다 덜 유효하지 않습니다. 실제로 ABC는 특수한 유형의 비모수 적 베이지안 통계로 볼 수 있습니다.

  4. 또한 (잡음) ABC는 원래 모델과 데이터를 잡음이있는 것으로 바꾸는 경우 완벽하게 정의 된 베이지안 접근 방법임을 알 수 있습니다. 따라서 모든 베이지안 추론을 생각할 수 있습니다. 테스트 포함 우리의 입력 ABC 및 가설 검정에 대한 논쟁은 ABC의 기초가되는 대략적인 모델로 끝날 수 있다는 것이다 제대로 장착 되지 않은 데이터 주어진 가설의 타당성을 평가하기 위해,하지만 반드시 인구 ABC의 대부분의 응용 프로그램 때문에 단지뿐만 아니라이다, 유전학은 모델 선택과 관련이 있습니다.

  5. 보다 최근의 관점에서, 통계 모델의 매개 변수가 사전 결정된 통계의 순간과 관련되는 간접 추론 의 베이지안 버전으로 ABC를 볼 수 있습니다 . 이 통계가 이러한 모수를 식별하기에 충분하거나 (상대적으로 의미가있는 경우) ABC는 관측치의 수와 함께 모수의 실제 값 으로 수렴 하는 것으로 표시 될 수 있습니다 .


2
이 답변을 확인했지만 @ Björn의 답변을 먼저 읽고 (+1) 시안의 답변을 읽는 것이 좋습니다.
Remi.b

12

차이점은 ABC를 사용하면 대한 분석 표현식이 필요하지 않고 대신 데이터를 시뮬레이션하고 시뮬레이션 데이터의 값이 관찰 된 데이터와 가장 자주 (대략) 일치 하는 값을 확인하여이를 추정하는 것입니다. 예를 들어 이전에서 임의로 추출한 값). 표본 크기가 너무 크지 않은 단일 이항 난수 변수와 같은 간단한 경우에는 정확히 일치해야 할 수도 있으며, 이러한 경우에는 이러한 사후 샘플로는 할 수없는 것이 전혀 없습니다. 표준 MCMC 샘플. 연속적 (다변량 불연속 결과의 경우에도) 및 정확한 일치가 필요한 다변량 결과가 더 복잡한 상황에서는 더 이상 적합하지 않습니다.(엑스|θ)θ

실제로 MCMC 버전의 ABC가 있는데, 이는 이전과 밀접한 연관이없는 (예를 들어, 이전이 매우 유익하지 않기 때문에) 이전과 유사한 경우 이전에서 추출한 샘플링이 매우 비효율적이라는 문제를 해결합니다. 관찰 된 데이터와 시뮬레이션 된 데이터간에 밀접한 일치를 얻습니다.

때 분석적으로 볼 수 있습니다, 나는 거의 항상 표준 MCMC를 사용하는 것이보다 더 낫다 될 것입니다 가정합니다. 의 평가 가 ABC가 더 잘 수행 할 정도로 계산적으로 비싸다는 것을 생각할 수 있습니다. 아마도 누군가가 이것의 예를 알고있을 것입니다. 대조적으로 나는 표준 MCMC 접근법이 옵션이 아닐 때 주로 ABC 또는 MCMC-ABC (또는 다른 많은 ABC 변형 중 하나)를 고려할 것입니다.(엑스|θ)(엑스|θ)(엑스|θ)분석적으로 사용할 수 없습니다. 물론 그러한 경우에는 특정 문제에 대해 더 효율적이거나 성공할 수있는 다른 가능한 옵션 (예 : INLA, 가능성에 대한 2 차 근사 등)이있을 수 있습니다. 어떤 식 으로든 ABC의 사후 샘플로 수행 할 수있는 모든 제한 사항은 실제 데이터와 시뮬레이션 된 데이터 사이의 근사 일치 만 필요하기 때문에 발생합니다 (정확한 일치가 필요할 수있는 경우 전혀 문제가 없음). 예를 들어 Marin et al. (2012) . 공동 저자 중 한 명 (@ Xi'an)은 여기에 적극적으로 참여하고 있으며 그의 생각도 좋아합니다. 테스팅 주제에 대해 더 많이 말할 수 있다고 생각합니다.


나는 지금 링크를 고칠 수 있기를 희망한다 (이제 나에게 효과적이다).
Björn

1
(+1) 아주 좋은 점수!
시안

1
"P (x | θ)를 분석적으로 사용할 수 있으면 표준 MCMC를 사용하는 것이 거의 항상 바람직 할 것입니다." 거의 항상 그런 것은 아닙니다. 많은 매개 변수와 결합 된 매우 큰 표본 크기 (10 ^ 9)가 있다고 상상해보십시오. 각 매개 변수 세트에 대한 가능성을 재 계산하는 것은 매우 비싸게됩니다. ABC에는 속도를 높이기 위해 사용할 수있는 많은 트릭이 있습니다. MCMC로는 그렇게 많지 않습니다.
z_dood

2
@z_dood : 가능성을 계산하기에 너무 많은 관측치가있는 경우 (예 : 다른 컴퓨터에 저장해야하는 경우) 가능성 기능을 분석적으로 사용할 수없는 것은 논란의 여지가 있습니다.
시안
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.