빈도에 대한 베이지안 추론 이전의 베타 접합체 이해


11

다음은 Bolstad의 베이지안 통계 소개 에서 발췌 한 것입니다 .

나는 t를 읽고있다

거기에있는 모든 전문가에게 이것은 사소한 것일 수 있지만 저자가 우리가 어떤 값에 대한 사후 확률을 계산하기 위해 통합을 수행 할 필요가 없다는 결론을 내릴 수 없습니다 . 나는 두 번째 표현 인 비례와 모든 용어의 유래를 이해합니다 ( likelihood x Prior) . 또한 분자만이 비례하기 때문에 분모에 대해 걱정할 필요가 없습니다. 그러나 세 번째 방정식 으로 넘어 가면 베이 즈 규칙의 분모를 잊어 버리지 않습니까? 어디 갔어? 그리고 감마 함수에 의해 계산 된 값은 상수가 아닌가? 베이 즈 정리에서 상수가 취소되지 않습니까?π


5
하나의 가능한 상수, 즉 함수를 확률 밀도로 만드는 상수 만 있습니다.
시안

답변:


10

xα1×(1x)β1Γ(α+β)Γ(α)Γ(β)


8

설정

pbeta(α,β)x|pbinomial(n,p)
f(p)=1B(α,β)pα1(1p)β1
g(x|p)=(nx)px(1p)nx
1B(α,β)=Γ(α+β)Γ(α)Γ(β).

암시 적 버전

지금. 사후 분포는 종래에 비례 우도 곱하여 . 상수 (즉 , 가 아닌 것들)를 무시할 수 있습니다 : fgp

h(p|x)f(p)g(p|x)=pα1(1p)β1pxpnx=pα+x1(1p)β+nx1.

여기에는 매개 변수가 및 인 베타 분포의 '모양'이 있으며 해당 매개 변수가있는 베타 분포 에 해당하는 정규화 상수는 다음과 같습니다. . 또는 감마 함수 측면에서 다시 말해서, 우리는 여분의 레거시없이 비례 관계보다 조금 더 잘 할 수 있으며, 평등으로 직진 할 수 있습니다 : α+xβ+nx1/B(α+x,β+nx)

1B(α+x,β+nx)=Γ(n+α+β)Γ(α+x)Γ(β+nx).
h(p|x)=Γ(n+α+β)Γ(α+x)Γ(β+nx)pα+x1(1p)β+nx1.

따라서 베타 배포 구조에 대한 지식을 사용하여 복잡한 통합 등을 거치지 않고 후자의 표현을 쉽게 복구 할 수 있습니다.

관절 분포의 정규화 상수를 암시 적으로 취소하여 혼동을 일으킬 수 있습니다.

명시 적 버전

당신은 또한 절차 적으로 물건을 갈아 낼 수 있습니다.

실제로 그렇게 오래 걸리지는 않습니다. 관절 분포를 로 표현할 수 있습니다. 과의 여백 분포 으로

f(p)g(x|p)=1B(α,β)(nx)pα+x1(1p)β+nx1
x
01f(p)g(x|p)dp=1B(α,β)(nx)01pα+x1(1p)β+nx1dp=1B(α,β)(nx)Γ(α+x)Γ(β+nx)Γ(α+β+nx)

따라서 베이 즈 정리를 사용하여 이것은 이전에 얻은 것과 동일합니다.

h(p|x)=f(p)g(x|p)01f(p)g(x|p)dp=1B(α,β)(nx)pα+x1(1p)β+nx11B(α,β)(nx)Γ(α+x)Γ(β+nx)Γ(α+β+n)=Γ(n+α+β)Γ(α+x)Γ(β+nx)pα+x1(1p)β+nx1

7

총론

비욘 좀 더 명시 적으로 같은 시간에 더 일반적인 @에 의해 주어진 답을하려면, 우리는 우리가 도착 있음을 유의 베이 즈 정리 에서

p(θ|X)×p(X)=p(X,θ)=p(X|θ)×p(θ)

p(θ|X)=p(X|θ)×p(θ)p(X) (Bayes Thereom)

여기서 는 관측 된 데이터를 나타내며 알 수없는 매개 변수 인 에 대해 확률 론적 추론을하고 싶습니다. 질문의 경우 매개 변수는 알 수없는 주파수 입니다. 단순하게 유지하기 위해 벡터 또는 스칼라에 대해 이야기하고 있는지 걱정하지 마십시오.Xθπ

연속적인 경우의 한계 화

p(X)=+p(X,θ)dθ=+p(X|θ)×p(θ)dθ

여기서 공동 분포 는 위에서 보았 듯이 같습니다 . 그것은이다 일정한 그것은 단지에 따라 매개 변수 '밖으로 통합'이후부터 일정한 조건을 .p(X,θ)likelihood×prior

그러므로 우리는 베이 즈 정리를 다음 과 같이 재구성 할 수 있습니다.

p(θ|X)=Const.×p(X|θ)×p(θ)Const.=1p(X)=1p(X|θ)×p(θ)dθ

따라서 베이 즈 정리 의 일반적인 비례 형태 에 도달합니다 .

문제를 손에 적용

이제 우리는 질문의 경우의 가 형식 이기 때문에 우리가 아는 것을 간단히 꽂을 준비가되었습니다.likelihood×prior

p(X,θ)=p(X|θ)×p(θ)=Aθa+y1(1θ)b+ny1=Aθa1(1θ)b1

여기서 , 및 여기서 은 이항 우도 및 베타에서 상수 항을 수집합니다. 이전.a=a+yb=b+nyA=1B(a,b)(ny)

이제 @ Björn의 답변을 사용하여 이것이 베타 함수 곱하기 상수 항 의 집합에 통합 되어 있음을 알 수 있습니다.B(a,b)A

p(X)=A01θa1(1θ)b1dθ=AB(a,b)

p(θ|X)=Aθa1(1θ)b1AB(a,b)=θa1(1θ)b1B(a,b)

관절 분포에서 상수 항은 항상 지명자 분모에 동시에 나타나기 때문에 항상 취소 되므로 (@jtobin이 제공 한 답변 참조) 실제로 귀찮게 할 필요는 없습니다.

따라서 우리의 사후 분포는 사실 이전의 매개 변수 및 를 간단히 업데이트 하여 후부에 도달 할 수 있는 베타 분포 라는 것을 알고 있습니다 . 그렇기 때문에 이전에 배포 된 베타를 켤레 이전 이라고합니다 . b = b + n ya=a+yb=b+ny


이 추론은 암시 적 버전의 jtobin과 유사합니다. 모수를 포함하는 가능성 시간의 일부만 살펴보고 정규화 상수에서 다른 모든 것을 수집 합니다. 따라서 우리는 적분을 최종 단계로만 통합을 봅니다. jtobin이 명시 적 버전에서 보여준 것처럼 상수가 취소되기 때문입니다.
gwr
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.