10D MCMC 체인이 주어지면 R에서 사후 모드를 어떻게 확인할 수 있습니까?


10

질문 : 10 차원 MCMC 체인을 사용하여 10 개의 매개 변수 (열)에 의한 100,000 회 반복 (행), 사후 모드를 가장 잘 식별 할 수있는 방법은 무엇입니까? 특히 다중 모드에 관심이 있습니다.

배경:나는 계산에 정통한 통계학 자라고 생각하지만, 동료가이 질문을했을 때, 나는 합리적인 대답을 얻을 수 없다는 것이 부끄러웠다. 주요 관심사는 여러 모드가 나타날 수 있지만 10 개 차원 중 8 개 이상이 고려되는 경우에만 해당됩니다. 나의 첫 번째 생각은 커널 밀도 추정치를 사용하는 것이었지만 R을 통한 검색은 3 차원 이상의 문제에 대해서는 유망한 것이 없음을 보여 주었다. 동료는 10 차원의 임시 비닝 전략을 제안하고 최대 값을 찾고 있지만 대역폭에 심각한 희소성 문제가 발생하거나 여러 모드를 식별 할 수있는 해상도가 부족할 수 있습니다. 즉, 자동 대역폭 제안, 10 커널 밀도 추정기 링크 또는 기타 알고 싶은 사항에 대한 제안을 기꺼이 받아들입니다.

우려 사항 :

  1. 우리는 분포가 상당히 왜곡 될 수 있다고 생각합니다. 따라서 우리는 사후 수단이 아닌 사후 모드를 식별하고자합니다.

  2. 우리는 여러 가지 사후 모드가있을 수 있습니다.

  3. 가능하면 R 기반 제안을 선호합니다. 그러나 구현하기가 어렵지 않는 한 모든 알고리즘이 작동합니다. 처음부터 자동화 된 대역폭 선택으로 Nd 커널 밀도 추정기를 구현하지 않는 것이 좋습니다.


추정 방법은 고속 모드에 대한 주제를 참조하십시오 stats.stackexchange.com/questions/33625
파벨 Ruzankin

답변:


9

가장 가까운 이웃 접근 방식을 사용해 보셨습니까?

예를 들어 k100,000 개의 점 각각에 대해 가장 가까운 이웃 의 목록을 구축 한 다음 가장 가까운 이웃의 거리를 가진 데이터 점을 kth모드 로 간주하십시오 . 즉, k이 점 주위에 다른 점이 포함 된 '가장 작은 거품'이있는 점을 찾으십시오 .

이것이 얼마나 강력하고 확실하지 않은지 확실 k하게 결과에 영향을 미칩니다.


때때로 나는 단지 머리를 거꾸로 세우고 싶다. 훌륭한 제안.
M. Tibbits

1
나는 또한 kmeansR 에서 함수 를 사용하려고 생각했습니다 . 자정과 오전 4시 사이에는 질문하지 않아야합니다.
M. Tibbits

4

이것은 부분적인 답변 일뿐입니다.

최근 에 다차원 커널 밀도 추정에 figtree 를 사용 했습니다 . 그것은 C 패키지이며 상당히 쉽게 작동하도록했습니다. 그러나 요약 통계를 계산하지 않고 특정 지점의 밀도를 추정하는 데만 사용했습니다.


3

로그 가능성을 유지하면 가장 높은 값을 가진 로그를 선택할 수 있습니다. 또한 관심이 주로 모드 인 경우 로그 가능성이 가장 높은 지점을 찾기 위해 최적화를 수행하면 충분합니다.


이것은 적어도 첫 번째 부분에서 가장 관련성이 높은 답변입니다! 많은 MCMC 시뮬레이션에서 (log-) 가능성은 모든 제안에 대해 계산되므로 저장할 수 있습니다. 또는 지금까지 가장 높은 값과 해당 인수를 저장할 수 있습니다. MCMC 알고리즘이 실행 한 시뮬레이션 수에 대해 수렴 된 경우 유효한 접근 방식입니다.
Xi'an

2

'PRIM / 범프 사냥'을 고려하셨습니까? (Tibshirani 등의 '통계 학습 요소'섹션 9.3.을 참조하거나 즐겨 찾는 검색 엔진에 문의하십시오). 그래도 R로 구현되었는지 확실하지 않습니다.

[내가 아는 한 100,000 개의 행이 그려지는 확률 밀도의 모드를 찾으려고 노력하고 있습니까? 따라서 적절한 density estimation방법 을 찾아서 문제를 부분적으로 해결할 수 있습니다 ].


네, 거기에 꼼꼼한 패키지는 R 비네팅 : 범프 사냥에 대한 꼼꼼한 사용 . 그러나이 경우 어떻게 작동하는지는 분명하지 않습니다.
chl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.