스케일이 무엇인지에 대한 대략적인 아이디어가있을 때 스케일 모수 (정규 분포, t 분포 등)에 대한 사전 분포로 로그 정규 분포를 사용하고 있지만 알지 못한다는 측면에서 잘못하고 싶습니다. 그것에 대해 많이. 나는 그 사용이 나에게 직관적으로 의미가 있기 때문에 그것을 사용하지만 다른 사람들이 그것을 사용하는 것을 보지 못했습니다. 이것에 숨겨진 위험이 있습니까?
스케일이 무엇인지에 대한 대략적인 아이디어가있을 때 스케일 모수 (정규 분포, t 분포 등)에 대한 사전 분포로 로그 정규 분포를 사용하고 있지만 알지 못한다는 측면에서 잘못하고 싶습니다. 그것에 대해 많이. 나는 그 사용이 나에게 직관적으로 의미가 있기 때문에 그것을 사용하지만 다른 사람들이 그것을 사용하는 것을 보지 못했습니다. 이것에 숨겨진 위험이 있습니까?
답변:
약간의 유익한 분포 를 위해 "두 번째 종류의 베타 분포"( 짧은 경우 베타 2 ) 를 사용하고 사전에 강한 믿음 이있는 경우 공액 역 감마 분포를 사용하는 것이 좋습니다 . 이것이 내가 말하는 이유 는 이전과 데이터가 충돌하면 이전 의 사후 분포에 무한한 영향을 미친다 는 점에서 접합체 선행이 강력하지 않기 때문 입니다. 그러한 행동은 내가“독단적”이라고 부르는 것이며, 가벼운 사전 정보로 정당화되지는 않습니다 .
견고성 을 결정하는 속성 은 이전과 가능성의 꼬리 동작입니다. 기술적 인 세부 사항을 설명하는 아주 좋은 기사가 여기 있습니다 . 예를 들어, 관측 값 y i 와 같이 가능성을 선택할 수 있습니다 (예 : t- 분포). (임의로 커짐)와 같이 위치 매개 변수의 분석에서 제외그러한 관찰로하십시오). "폐기"비율은 분포의 꼬리가 얼마나 무거운 지에 달려 있습니다.
계층 적 모델링 컨텍스트에서 애플리케이션을 보여주는 일부 슬라이드는 여기 에서 찾을 수 있습니다 (베타의 수학적 형식을 보여줍니다) 이 종이로, 유통) 여기 .
계층 적 모델링 컨텍스트에 있지 않은 경우, 사후 (또는 생성하는 결과)를 비교하는 것이 좋지만 스케일 매개 변수에 대해 Jeffreys를 사용하십시오 . 이는두 매개 변수가 모두 0으로 수렴되므로 베타2밀도의 한계로 만들 수 있습니다. 근사값으로 작은 값을 사용할 수 있습니다. 그러나 나는 해결책을 찾으려고 노력할 것이다. 분석적 이 아니라 자신을 저장 약간의 계산 시간,하지만 당신이 있기 때문에, 만약 모든 가능한에서 (그리고 지금까지 당신이 가능하게 할 수 있던대로 진행으로하지 않을 경우 완전한 분석 솔루션은 분석 솔루션을 얻을) 또한 모델에서 일어나는 일을 더 잘 이해할 수 있습니다.
다른 대안은 이전의 정보를 제약 조건의 형태로 지정하는 것입니다 (평균은 , 분산은 V , IQR은 I Q R 등입니다. M , V , I Q R 값은 직접 지정). 그런 다음 Jeffreys의 "불변 측정" m ( σ ) = 1 과 관련 하여 최대 엔트로피 분포 (Edwin Jaynes 또는 Larry Bretthorst의 Maximum Entropy가 무엇인지 아닌지에 대한 자세한 설명을 찾기 위해 모든 작품을 검색)를 사용하십시오. .
MaxEnt는 "Rolls Royce"버전이고 Beta 2 는 "sedan"버전입니다. 그 이유는 MaxEnt 분포가 사용자가 입력 한 제약 조건에 따라 "최소한 것으로 가정"하기 때문입니다 (예 : 제약 조건이 없으면 Jeffreys를 미리 얻는 것을 의미 함). Beta 2 배포판에는 "숨겨진"기능이 포함될 수 있습니다. 특정 경우에 바람직하지 않을 수도 있습니다 (예 : 이전 정보가 더 신뢰할 수있는 경우) 데이터 경우 베타 2 는 나쁩니다).
MaxEnt 분포의 또 다른 장점 은 데이터 생성 메커니즘에서 작동하는 지정되지 않은 제약 조건이없는 경우 MaxEnt 분포가 압도적 으로 가장 많이 볼 수있는 분포라는 것입니다 (우리는 수십억 조에서 1 조에 이르는 확률로 이야기하고 있습니다). 따라서 표시되는 분포가 MaxEnt 가 아닌 경우 실제 프로세스에서 작동하도록 지정하지 않은 추가 제한 조건 이있을 수 있으며 관찰 된 값은 해당 제한 조건이 무엇인지에 대한 힌트를 제공 할 수 있습니다.
Daniels의 다음 논문은 분산에 대한 다양한 수축 사전을 비교합니다. 이것들은 적절한 선행 사항이지만 비 정보 적이라고 할 수있는 사람이 몇 명인지 확실하지 않습니다. 그러나 그는 또한 정보가없는 사전의 목록을 제공합니다 (모두 적절한 것은 아님). 아래는 참조입니다.
MJ Daniels (1999), 계층 적 모델의 차이에 대한 선행 , Canadian J. Stat. , vol. 27 번 3, 567–578 쪽.
이전
관련 정맥의 또 다른 최신 논문은 다음과 같습니다.
A. Gelman (2006), 계층 적 모델에서 분산 모수에 대한 사전 분포 , Bayesian Analysis , vol. 1 번 3, 515–533 쪽.
(질문은 오래되었지만 문제는 아닙니다)
개인적으로, 나는 당신의 직감이 의미가 있다고 생각합니다. 즉, 수렴의 수학적 단정함이 필요하지 않은 경우 위치 매개 변수에 사용할 분포에 관계없이 스케일 매개 변수의 로그에 동일한 분포를 사용해야합니다. 그래서 당신이 말하는 것은 : 보통의 이전과 동등한 것을 사용하십시오.
실제로 위치 매개 변수에 일반 사전을 사용 하시겠습니까? 대부분의 사람들은 분산을 크게 만들지 않는 한 여기에 다른 답변 (무한한 영향)에 설명 된 이유로 약간 "너무 독단적"일 것이라고 말합니다. 경험적인 베이를 수행하는 경우는 예외입니다. 즉, 데이터를 사용하여 이전의 매개 변수를 추정합니다.
"약한 정보"를 원한다면 아마도 꼬리가 더 굵은 분포를 선택할 것입니다. 명백한 후보는 t 분포입니다. Gelman의 최신 조언 은 3-7의 df와 함께 사용하는 것으로 보입니다. (이 링크는 위치에 대해 수행 할 스케일 로그와 동일한 작업을 수행하려는 제안을 지원합니다.) 따라서 로그 정규 대신 대신 log-student-t를 사용할 수 있습니다. 스탠에서이 작업을 수행하려면 다음과 같은 작업을 수행 할 수 있습니다.
real log_sigma_y; //declare at the top of your model block
//...some more code for your model
log_sigma_y <- log(sigma_y); increment_log_prob(-log_sigma_y);
log_sigma_y ~ student_t(3,1,3); //This is a 'weakly informative prior'.
그러나 위의 코드가 너무 복잡하면 두 가지주의 사항을 사용하여 로그 로그를 미리 얻을 수 있다고 생각합니다. 먼저, "확실하지 않다"는 당신의 대략적인 추측보다 그 이전의 변화를 몇 배 넓게 만드십시오. 강력한 정보가 아닌 약한 정보가 필요한 사전을 원합니다. 둘째, 모델에 적합하면 매개 변수의 후방 중앙값을 확인하고 로그의 로그가 로그 정규의 중심에서 너무 멀지 않은지 확인하십시오. "너무 멀지 않은"은 아마도 표준 편차가 2 개 미만, 바람직하게는 SD가 2 개 이하인 것을 의미합니다.
계층 적 모델 척도 모수의 경우, 주로 Andrew Gelman의 접힌 비 중심 t- 분포 사용 제안 을 사용했습니다. 이것은 나에게 꽤 괜찮 았습니다.