정보가없는 베타 이전 버전 중에서 선택


17

베타 분포가 이항 공정 (Hit / Miss)에서 작동하기위한 유익한 정보를 찾고 있습니다. 처음 에는 균일 한 PDF를 생성하는 또는 α = 0.5 , β = 0.5 이전의 Jeffrey 사용에 대해 생각했습니다 . 그러나 실제로 사후 결과에 최소한의 영향을 미치는 사전을 찾고 있는데 α = 0 , β = 0 이전에 부적절한 것을 사용하는 것에 대해 생각했습니다 . 여기서 문제는 하나 이상의 적중과 한 번의 누락이있는 경우에만 후방 분포가 작동한다는 것입니다. 이것을 극복하기 위해 나는 매우 작은 상수를 사용하는 것에 대해 생각했습니다.α=1,β=1α=0.5,β=0.5α=0,β=0 , 단지 후방 α β > 0 이되도록합니다.α=0.0001,β=0.0001αβ>0

이 접근법이 수용 가능한지 아는 사람이 있습니까? 나는 이것들을 이전에 바꾸는 것의 수치 적 효과를 보았지만 누군가 나에게 이와 같은 작은 상수를 넣는 것에 대한 일종의 해석을 줄 수 있습니까?


1
많은 적중과 누락이있는 큰 샘플의 경우 차이가 거의 없습니다. 작은 샘플의 경우, 특히 하나 이상의 적중과 하나의 누락이없는 경우 큰 차이를 만듭니다. "매우 작은 상수"의 크기조차도 상당한 영향을 줄 수 있습니다. 당신의 샘플 크기 후 의미가 있습니다 종류의 후방의 어떤 수를 위해 나는 키 사고 실험을 제안 이 당신에게 제프리 같은 뭔가 설득 수 있습니다 이전이 합리적이다1
헨리

그리고 Kerman이 1/3 & 1/3, b를 제안하는 논문이 있습니다
Björn

'후부 결과에 대한 최소한의 영향'은 무엇을 의미합니까? 무엇에 비해?
Will

질문의 형식과 제목을 향상 시켰으며 수정 사항을 되돌 리거나 변경해도됩니다.

답변:


33

우선, 유익하지 않은 사전과 같은 것은 없습니다 . 아래는 다른 데이터가 주어 졌을 때 5 개의 다른 "정보가없는"선행 (그림 아래에 설명)으로 인한 사후 분포를 볼 수 있습니다. 보다시피 알 수 있듯이 "정보가없는"이전의 선택은 특히 데이터 자체가 많은 정보를 제공하지 않은 경우 사후 분포에 영향을 미쳤습니다 .

정보가없는 이전의 후부

α=βα1,β1α=β=1α=β=1/2α=β=1/3α=β=0), 또는 그것의 근사 ( ε > 0 ) (또한 참조 큰 위키 백과 문서를 ).α=β=εε>0

n 번의 시도 에서 y 성공을 관찰 한 후 베타-이항 모델 의 후방 분포는 다음 과 같기 때문에 베타 사전 분포의 매개 변수는 일반적으로 성공 ( )과 실패 ( β ) 의 "의사 횟수"로 간주됩니다.αβyn

θyB(α+y,β+ny)

α,βα=β=1n

첫눈에, Haldane은 이전 평균이 최대 가능성 추정치와 정확히 일치하기 때문에 사후 평균으로 이어지기 때문에 가장 "정보가없는"것으로 보인다

α+yα+y+β+ny=y/n

y=0y=n

각각의 "정보가없는"선행에 대해 많은 논쟁이있다 (Kerman, 2011; Tuyl et al, 2008 참조). 예를 들어, Tuyl et al.

101

다른 한편으로, 작은 데이터 세트에 대해 균일 한 우선 순위를 사용하는 것은 매우 영향력이있을 수 있습니다 (의사 계수로 생각하십시오). 이 주제에 대한 더 많은 정보와 토론은 여러 백서 및 핸드북에서 찾을 수 있습니다.

죄송하지만, "최고", "가장 유익하지 않은"또는 "한 사이즈"모든 것은 없습니다. 각각은 모델에 정보를 제공합니다.

Kerman, J. (2011). 중성 비 정보 및 유익한 결합체 베타 및 감마 사전 분포. 전자 통계 저널, 5, 1450-1470.

Tuyl, F., Gerlach, R. 및 Mengersen, K. (2008). Bayes-Laplace, Jeffreys 및 기타 이전의 비교. 미국 통계 학자, 62 (1) : 40-44.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.