일련의 테스트 밀도에서 여러 가지 다른 알고리즘의 성능을 비교하는 MCMC 방법에 대한 대규모 연구가 있었습니까? Rios and Sahinidis의 논문 (2013) 과 비슷한 것을 생각 하고 있는데 , 이는 여러 클래스의 테스트 기능에 대한 많은 파생없는 블랙 박스 최적화 프로그램을 철저히 비교 한 것입니다.
MCMC의 경우, 성능은 예를 들어 밀도 평가 당 유효 샘플 수 (ESS) 또는 다른 적절한 메트릭으로 추정 할 수 있습니다.
몇 가지 의견 :
성능은 대상 PDF의 세부 사항 에 크게 의존 하지만, 유사한 (아마도 동일하지는 않음) 최적화에 대한 주장이지만, 벤치마킹 최적화를 다루는 벤치마킹 기능, 스위트, 경쟁, 논문 등이 많이 있습니다. 알고리즘.
또한 MCMC는 사용자에게 훨씬 더 많은주의와 조정이 필요하다는 점에서 최적화와 다릅니다. 그럼에도 불구하고, 튜닝을 거의 또는 전혀 필요로하지 않는 몇 가지 MCMC 방법이 있습니다 : 번인 단계에서, 샘플링 동안 적응하는 방법 또는 여러 상호 작용하는 체인을 진화시키고 사용하는 다중 상태 ( 앙상블 이라고도 함 ) 방법 (예 : Emcee ) 샘플링을 안내하는 다른 체인의 정보.
특히 표준과 다중 상태 (일명 앙상블) 방법의 비교에 관심이 있습니다. 다중 상태의 정의에 대해서는 MacKay 책의 30.6 절을 참조하십시오 .
- 이 질문은 여기서 시작되었습니다 .