MCMC 샘플러에 Jeffrey 또는 엔트로피 기반 사전을 사용하는 것에 대한 권장 사항이있는 이유는 무엇입니까?


11

자신의 위키 페이지 , 스탠 상태의 개발자 :

우리가 싫어하는 일부 원칙 : 불변성, Jeffreys, 엔트로피

대신 많은 정규 배포 권장 사항이 있습니다. 지금까지 샘플링에 의존하지 않는 베이지안 방법을 사용했는데 왜 는 이항 우도에 적합합니다.θBeta(α=12,β=12)


1
일반적인 의견 : 소프트웨어 설명서가 소프트웨어가 수행하는 것과 수행하지 않은 것에 대한 통계적 주장을 항상 요약하지는 않습니다. 그것은 내가 본 대부분의 R 패키지에 해당하며 Stan과 같은 소식을 듣는 것에 놀라지 않습니다. Andrew Gelman은 아마도 많은 작가입니다.
Nick Cox

1
더 일반적인 의견 :이 종류의 질문은 부분적으로 특정 개인에 관한 것이므로 매우 만족스럽지 않습니다. 실제 작가가 어딘가에서 설명하지 않고 여기에서 활발하게 활동하지 않는다면, 이메일을 보내서 물어보십시오. 서로 다른 접근 방식의 상대적인 장점에 대한 추상화를 요청하는 것이 더 만족 스럽습니다. 직접 작성하는 것을 포함하여 누락 된 것이 있으면 항상 다른 소프트웨어를 사용할 수 있다고 말하는 것이 공정한 경우가 있습니다. 비공개 : Stan을 사용한 적이 없습니다.
Nick Cox

@NickCox 나는이 질문이 익명화로부터 이익을 얻지 못했다고 생각한다. (1) samling 소프트웨어의 맥락이 중요하기 때문이다. 유명한 출처가 그 주장을합니다. (3) 질문에 누군가를 인용하는 것이 대립적이라고 생각하지 않습니다.
wirrbel

1
Andy는 "우리가 싫어하는 몇 가지 원칙 : 불변성, Jeffreys, 엔트로피"를 썼지 만 왜 그의
Ben Goodrich

1
또한이 백서 에는 3 명의 Stan 개발자들 사이의 이전에 대한 최신 생각 이 포함되어 있습니다.
벤 굿 리치

답변:


13

이것은 물론 다양한 의견을 모아서 위키를 작성하는 다양한 사람들입니다. 나는 몇 가지 논평을 알고 이해합니다.

  • 계산 편의성을 기반으로 사전을 선택하는 것은 근거가 충분하지 않습니다. 예를 들어 베타 (1/2, 1/2)는 켤레 업데이트가 가능하기 때문에 단독으로 사용하는 것은 좋지 않습니다. 물론, 그것이 당신이 작업하는 문제의 유형에 대해 좋은 속성을 가지고 있다고 결론 지으면 괜찮습니다. 그리고 구현을 쉽게 만드는 선택을 할 수도 있습니다. 편리한 기본 선택에 문제가있는 사례가 많이 있습니다 (Gibs 샘플링을 활성화하기 전에 Gamna (0.001, 0.001) 참조).

  • WinBUGS 또는 JAGS와 달리 Stan의 경우 사전 조건을 (조건부) 결합 할 때 특별한 이점이 없습니다. 따라서 계산 측면을 다소 무시할 수 있습니다. 완전히 꼬리가 붙지 않은 선행 (또는 부적절한 이전)과 매개 변수를 잘 식별하지 못하는 데이터로 인해 문제가 발생하기 때문에 (실제로 Stan 관련 문제는 아니지만 Stan은 이러한 문제를 식별하고 사용자에게 경고합니다. 행복하게 샘플링하는 대신).

  • Jeffreys 및 기타 "낮은 정보"이전의 사례는 때때로 부적절하거나 데이터가 부족한 높은 차원에서 (심지어 도출하지 않아도 됨) 이해하기 어려울 수 있습니다. 이로 인해 저자가 자신에게 익숙하지 않은 문제가 너무 자주 발생했을 수 있습니다. 무언가를하고 나면 더 많은 것을 배우고 편안해지며 가끔 의견이 반전됩니다.

  • 희소 데이터 설정에서 이전의 문제가 실제로 중요하며 매개 변수에 대해 완전히 무시할 수없는 값이 불가능하다는 것을 지정할 수 있으면 많은 도움이됩니다. 이것은 정보를 충분히 제공하는 사전이 아니라 그럴듯한 가치를 가장 많이지지하는 약한 정보의 사전 아이디어에 동기를 부여합니다.

  • 실제로 매개 변수를 실제로 잘 식별하는 데이터가 많으면 (최대 가능성을 사용할 수 있음) 왜 정보가없는 사전에 신경을 쓰는지 궁금 할 수 있습니다. 물론, 병리를 피하고, 사후의 "실제 형태"를 얻는 등의 많은 이유가 있지만, "다량의 데이터"상황에서는 약한 정보 이전에 대한 실질적인 논쟁이없는 것 같습니다.

  • 아마도 약간 이상하게도 N (0, 1)은 많은 응용에서 로지스틱, 포아송 또는 콕스 회귀 계수에 대해 놀랍게도 괜찮은 수준입니다. 예를 들어 이는 많은 임상 시험에서 관찰 된 치료 효과의 분포와 거의 같습니다.

자세한 답변 감사합니다. 나는 놀랍게도 활용성에 관한 것이 아니라고 생각합니다 (제대로 이해하면 Jeffreys 이전은 켤레 이전이 될 필요가 없으며 매개 변수를 수정하면 변하지 않아야합니다). 따라서 나는 켤레 이전에 대한 조언을 완전히 이해할 것입니다.
wirrbel

Jeffreys prior의 걱정은 대부분 사전에 적절하지 않을 수도 있고 완전히 이해하지 못하는 추론에 영향을 줄 수있는 높은 차원의 사전이라고 생각합니다. 나는 그것이 희소 데이터와 관련이 있다고 생각합니다. 어쩌면 누군가가 약간의 문제가 발생하는 비 희소 데이터의 예를 지적 할 수는 있지만 (아무도 모릅니다). Jeffreys 이전의 다양한 "정보가없는"옵션과 함께 실제로이를 파생시켜야하는 불편 함이 있습니다.
Björn

8

그것들은 그렇게하기위한 과학적 / 수학적 정당성을 제공하지 않습니다. 대부분의 개발자는 이러한 종류의 사전 작업을 수행하지 않으며, 편차가 큰 일반 사전 (일부 경우에 유익 할 수 있음)과 같이보다 실용적이고 휴리스틱 사전을 사용하는 것을 선호합니다. 그러나이 주제에 대한 작업을 시작한 후 Entropy (KL 분기)를 기반으로하는 PC 사전을 사용하는 것이 기쁘다는 것은 조금 이상합니다.

개발자들이 를 제프리스 (Jeffreys)의 모양과 비슷하기 때문에 정밀 파라미터에 대해 비 정보적인 것으로 권장했을 때 WinBUGS 에서도 비슷한 현상이 발생 했습니다. 이 이전은 정밀 매개 변수의 기본 이전이되었습니다. 나중에 그들은 Gelman!에 의해 매우 유익한 것으로 나타났습니다 .Gamma(0.001,0.001)


Gelman 주장에 유익한 하이퍼 링크 / 소스를 제공 할 수 있습니까?
Jim

@Jim Sure, 그것은 논문이다 : projecteuclid.org/euclid.ba/1340371048
이전
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.