척도 모수에 대한 유익한 사전 분포


21

스케일이 무엇인지에 대한 대략적인 아이디어가있을 때 스케일 모수 (정규 분포, t 분포 등)에 대한 사전 분포로 로그 정규 분포를 사용하고 있지만 알지 못한다는 측면에서 잘못하고 싶습니다. 그것에 대해 많이. 나는 그 사용이 나에게 직관적으로 의미가 있기 때문에 그것을 사용하지만 다른 사람들이 그것을 사용하는 것을 보지 못했습니다. 이것에 숨겨진 위험이 있습니까?


1
노멀에는 켤레 우선 순위가 있습니다 : en.wikipedia.org/wiki/Normal-gamma_distribution . 사용하기가 훨씬 쉬울 수 있습니다.
whuber

흥미 롭군 나는 수치적인 일을하고 있는데, 관용 외에 이러한 분포에 이점이 있습니까?
John Salvatier

5
실제로 내 지역은 아니지만이 '관련'이 관련이 있습니까? Gelman A. 계층 적 모델에서 분산 모수에 대한 사전 분포. 베이지안 분석 2006; 1 : 515–533. dx.doi.org/10.1214/06-BA117A
의 OneStop

내가 발견 한 확장 된 베타 2 페레즈와 Pericchi에 의해 제안 된 분포를. 2

정규 분포와 같은 특정 분포에 대한 공액 사전은 데이터 세트가 주어진 후의 분포로 해당 분포를 유도하는 바로 이전의 것입니다. 켤레를 먼저 사용하는 경우 사후를 계산하기 위해 통합을 수행 할 필요가 없습니다. 편리하게 만들지 만 요즘 MCMC에서는 다양한 사전을보다 쉽게 ​​사용할 수 있습니다.
Michael R. Chernick

답변:


20

약간의 유익한 분포 를 위해 "두 번째 종류의 베타 분포"( 짧은 경우 베타 2 ) 를 사용하고 사전에 강한 믿음 이있는 경우 공액 역 감마 분포를 사용하는 것이 좋습니다 . 이것이 내가 말하는 이유 는 이전과 데이터가 충돌하면 이전 의 사후 분포에 무한한 영향을 미친다 는 점에서 접합체 선행이 강력하지 않기 때문 입니다. 그러한 행동은 내가“독단적”이라고 부르는 것이며, 가벼운 사전 정보로 정당화되지는 않습니다 .

견고성 을 결정하는 속성 은 이전과 가능성의 꼬리 동작입니다. 기술적 인 세부 사항을 설명하는 아주 좋은 기사가 여기 있습니다 . 예를 들어, 관측 값 y i 와 같이 가능성을 선택할 수 있습니다 (예 : t- 분포). (임의로 커짐)와 같이 위치 매개 변수의 분석에서 제외그러한 관찰로하십시오). "폐기"비율은 분포의 꼬리가 얼마나 무거운 지에 달려 있습니다.yi

계층 적 모델링 컨텍스트에서 애플리케이션을 보여주는 일부 슬라이드는 여기 에서 찾을 수 있습니다 (베타의 수학적 형식을 보여줍니다) 종이로, 유통) 여기 .

계층 적 모델링 컨텍스트에 있지 않은 경우, 사후 (또는 생성하는 결과)를 비교하는 것이 좋지만 스케일 매개 변수에 대해 Jeffreys를 사용하십시오 . 이는두 매개 변수가 모두 0으로 수렴되므로 베타2밀도의 한계로 만들 수 있습니다. 근사값으로 작은 값을 사용할 수 있습니다. 그러나 나는 해결책을 찾으려고 노력할 것이다.p(σ)1σ 분석적 이 아니라 자신을 저장 약간의 계산 시간,하지만 당신이 있기 때문에, 만약 모든 가능한에서 (그리고 지금까지 당신이 가능하게 할 수 있던대로 진행으로하지 않을 경우 완전한 분석 솔루션은 분석 솔루션을 얻을) 또한 모델에서 일어나는 일을 더 잘 이해할 수 있습니다.

다른 대안은 이전의 정보를 제약 조건의 형태로 지정하는 것입니다 (평균은 , 분산은 V , IQR은 I Q R 등입니다. M , V , I Q R 값은 직접 지정). 그런 다음 Jeffreys의 "불변 측정" m ( σ ) = 1 과 관련 하여 최대 엔트로피 분포 (Edwin Jaynes 또는 Larry Bretthorst의 Maximum Entropy가 무엇인지 아닌지에 대한 자세한 설명을 찾기 위해 모든 작품을 검색)를 사용하십시오.MVIQRM,V,IQRm(σ)=1σ .

MaxEnt는 "Rolls Royce"버전이고 Beta 2 는 "sedan"버전입니다. 그 이유는 MaxEnt 분포가 사용자가 입력 한 제약 조건에 따라 "최소한 것으로 가정"하기 때문입니다 (예 : 제약 조건이 없으면 Jeffreys를 미리 얻는 것을 의미 함). Beta 2 배포판에는 "숨겨진"기능이 포함될 수 있습니다. 특정 경우에 바람직하지 않을 수도 있습니다 (예 : 이전 정보가 더 신뢰할 수있는 경우) 데이터 경우 베타 2 는 나쁩니다).

MaxEnt 분포의 또 다른 장점 은 데이터 생성 메커니즘에서 작동하는 지정되지 않은 제약 조건이없는 경우 MaxEnt 분포가 압도적 으로 가장 많이 볼 수있는 분포라는 것입니다 (우리는 수십억 조에서 1 조에 이르는 확률로 이야기하고 있습니다). 따라서 표시되는 분포가 MaxEnt 가 아닌 경우 실제 프로세스에서 작동하도록 지정하지 않은 추가 제한 조건 이있을 수 있으며 관찰 된 값은 해당 제한 조건이 무엇인지에 대한 힌트를 제공 할 수 있습니다.


@probabilityislogic 좋은 답변입니다. 세 번째 단락에서 언급 한 논문을 어디에서 찾을 수 있는지 알고 있습니까? 링크가 작동하지 않습니다.

1
종이를 위해 일하는 사람이 여기 있습니다 . 회의 "객관적인 베이 09"웹 사이트 (발렌시아 회의)에있었습니다. 컨퍼런스 웹 사이트가 다운되어 슬라이드를 더 이상 사용할 수 없다고 생각합니다 ... :( 죄송합니다, 좋은 슬라이드 세트였습니다. 사전에 제공 한 링크에서 그 호르 슈가 흥미로워 보입니다.
probabilityislogic

@probabilityislogic 아마도 뭔가 빠졌지 만 BA 논문에서 에 대한 참조를 찾을 수 없습니다 . Beta2

@Procrastinator 나는 당신이 적절한 선행을 원한다고 가정 할 권리가 있습니까? 당신은 그것을 말하지 않았지만 당신이 부적절한 사전을 허용한다면 이미 언급 한 Jeffreys의 사전이 효과가 있고 Jeffreys의 확률 이론, Dennis Lindley의 책 또는 통계 백과 사전을 인용 할 수 있습니다. 요청을 통해 Google을 사용하여 답변을 찾을 수있는 방법을 찾을 수없는 경우 아마도 출판 한 문헌 외에는 아무것도 없을 것입니다.
Michael R. Chernick

@MichaelChernick 네, 그렇습니다. 저는 적절한 사전에만 관심이 있습니다. 그 이유는 (1) 후부의 존재가 특정 모델에 제한적이지 않고 (2) 다른 흥미로운 제안이 누락되지 않았는지 확인하고 싶기 때문입니다. 나는 Gelman, Pericchi 및 Gamma 이전의 문헌이 문헌에서 가장 인기있는 것처럼 보이지만 '견고한'추론을 만들기 위해 두꺼운 꼬리의 선행을 제안하는 경향이 있음을 언급했습니다.

13

Daniels의 다음 논문은 분산에 대한 다양한 수축 사전을 비교합니다. 이것들은 적절한 선행 사항이지만 비 정보 적이라고 할 수있는 사람이 몇 명인지 확실하지 않습니다. 그러나 그는 또한 정보가없는 사전의 목록을 제공합니다 (모두 적절한 것은 아님). 아래는 참조입니다.

MJ Daniels (1999), 계층 적 모델의 차이에 대한 선행 , Canadian J. Stat. , vol. 27 번 3, 567–578 쪽.

이전

  1. K
  2. τ2
  3. τ1
  4. 1/(σ2+τ2)
  5. σ/(2(σ2+τ2)3/2)
  6. σ2/(σ2+τ2)
  7. σ/(2τ(σ+τ)2)

관련 정맥의 또 다른 최신 논문은 다음과 같습니다.

A. Gelman (2006), 계층 적 모델에서 분산 모수에 대한 사전 분포 , Bayesian Analysis , vol. 1 번 3, 515–533 쪽.


2
(+1) 이것은 좋은 발견입니다. 나는 Daniels 논문에 대한 안정적인 링크와 그것을 보완하는 다른 참조를 추가했습니다.
추기경

4

(질문은 오래되었지만 문제는 아닙니다)

개인적으로, 나는 당신의 직감이 의미가 있다고 생각합니다. 즉, 수렴의 수학적 단정함이 필요하지 않은 경우 위치 매개 변수에 사용할 분포에 관계없이 스케일 매개 변수의 로그에 동일한 분포를 사용해야합니다. 그래서 당신이 말하는 것은 : 보통의 이전과 동등한 것을 사용하십시오.

실제로 위치 매개 변수에 일반 사전을 사용 하시겠습니까? 대부분의 사람들은 분산을 크게 만들지 않는 한 여기에 다른 답변 (무한한 영향)에 설명 된 이유로 약간 "너무 독단적"일 것이라고 말합니다. 경험적인 베이를 수행하는 경우는 예외입니다. 즉, 데이터를 사용하여 이전의 매개 변수를 추정합니다.

"약한 정보"를 원한다면 아마도 꼬리가 더 굵은 분포를 선택할 것입니다. 명백한 후보는 t 분포입니다. Gelman의 최신 조언 은 3-7의 df와 함께 사용하는 것으로 보입니다. (이 링크는 위치에 대해 수행 할 스케일 로그와 동일한 작업을 수행하려는 제안을 지원합니다.) 따라서 로그 정규 대신 대신 log-student-t를 사용할 수 있습니다. 스탠에서이 작업을 수행하려면 다음과 같은 작업을 수행 할 수 있습니다.

real log_sigma_y; //declare at the top of your model block
//...some more code for your model
log_sigma_y <- log(sigma_y); increment_log_prob(-log_sigma_y);
log_sigma_y ~ student_t(3,1,3); //This is a 'weakly informative prior'.

그러나 위의 코드가 너무 복잡하면 두 가지주의 사항을 사용하여 로그 로그를 미리 얻을 수 있다고 생각합니다. 먼저, "확실하지 않다"는 당신의 대략적인 추측보다 그 이전의 변화를 몇 배 넓게 만드십시오. 강력한 정보가 아닌 약한 정보가 필요한 사전을 원합니다. 둘째, 모델에 적합하면 매개 변수의 후방 중앙값을 확인하고 로그의 로그가 로그 정규의 중심에서 너무 멀지 않은지 확인하십시오. "너무 멀지 않은"은 아마도 표준 편차가 2 개 미만, 바람직하게는 SD가 2 개 이하인 것을 의미합니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.