베이 즈 요소 업데이트


9

베이지안 계수는 iid 샘플 과 각 샘플링 밀도 및 주어진 경우 두 가지 한계 확률의 비율에 따라 가설 및 베이지안 모델 선택의 베이지안 테스트에서 정의됩니다. 및 와 함께 두 모델을 비교하기위한 베이 즈 계수는 나는 현재 검토하고 그 이상한 문이 베이 즈 요인 위(x1,,xn)f1(x|θ)f2(x|η)π1π2

B12(x1,,xn)=defm1(x1,,xn)m2(x1,,xn)=defi=1nf1(xi|θ)π1(dθ)i=1nf2(xi|η)π2(dη)
B12(x1,,xn) 는 "개별 요인 [Bayes factor]을 곱하여 형성됩니다"(p.118). 분해 그러나 의 업데이트로이 분해에서 계산상의 이점이 보이지 않습니다. 은 의 원래 계산과 동일한 계산 노력이 필요합니다
B12(x1,,xn)=m1(x1,,xn)m2(x1,,xn)=m1(xn|x1,,xn1)m2(xn|x1,,xn1)×m1(xn1|xn2,,x1)m2(xn1|xn2,,x1)××m1(x1)m2(x1)
m1(xn|x1,,xn1)m2(xn|x1,,xn1)
m1(x1,,xn)m2(x1,,xn)
인공 장난감 예제 외부.

질문 : Bayes 인수를 에서 \ mathfrak {B} _ {12} (x_1, \ ldots, x_ 로 업데이트하는 일반적이고 계산적으로 효율적인 방법이 있습니까? {n + 1}) 전체 마진을 다시 계산할 필요가 없습니다. m_1 (x_1, \ ldots, x_n)m_2 (x_1, \ ldots, x_n) ?B12(x1,,xn)B12(x1,,xn+1)m1(x1,,xn)m2(x1,,xn)

내 직감은 입자 필터 외에도 실제로 한 번에 하나의 새로운 관측 값으로 Bayes 요인 B12(x1,,xn) 추정을 진행하는 입자 필터 외에도이 질문에 대답하는 자연적인 방법은 없다는 것입니다 .


1
관측치가 iid 이기 때문에 문구가 반드시 순차적 인 인수 분해를 의미한다는 것은 분명하지 않습니다 . 대학원 과정에서 교수는이 제품 이 베이지안 분석에 점근 적 근사법을 사용할 있음을 암시 하지만 이상하게도이를 포착하지 못했음을 암시한다고 언급했습니다 . 아마도 그 책이 암시 할 수 있을까요?
Cliff AB

@CliffAB : 그렇습니다. 확률을 개별 분포의 평균으로 재 작성하여 실제 분포에서 쿨백-라이 블러 거리로 수렴 할 수 있습니다. 그러나 책이 모든 옵션을 열어 둘만큼 불분명 하더라도이 경우는 아니라고 생각합니다.
시안

1
두 번째로 표시된 방정식에 오타가 있다고 생각 합니다. 두 번째 줄의 두 번째 요소에서 이어야 합니까? m1(xn1|xn1,,x1)
jochen

답변:


4

아마도베이스 계수에 대한 재귀 방정식의 목적은 데이터 포인트에 대한 베이 즈 계수를 이미 계산하고 하나의 추가 데이터 포인트로이를 업데이트하려는 경우 일 것입니다. 사후 함수 의 형식을 알고 있는 한, 이전 데이터 벡터의 한계 값을 다시 계산하지 않고이 작업을 수행 할 수있는 것 같습니다 . 우리 가이 기능의 형태를 알고 있다고 가정하고 (질문과 같이 IID 데이터를 가정 할 때) 예측 밀도는 다음과 같이 쓸 수 있습니다.nπn

m(xn+1|x1,...,xn)=Θf(xn+1|θ)πn(dθ|x1,...,xn).

따라서, 당신은 :

m(x1,...,xn+1)=m(x1,...,xn)Θf(xn+1|θ)πn(dθ|x1,...,xn).

Bayes factor를 통해 두 모델 클래스를 비교하면 재귀 방정식을 얻습니다.

B12(x1,...,xn+1)=B12(x1,...,xn)Θ1f(xn+1|θ)π1,n(dθ|x1,...,xn)Θ2f(xn+1|θ)π2,n(dθ|x1,...,xn).

여기에는 여전히 매개 변수 범위에 대한 통합이 포함되므로 사용자가 제공하는 초기 공식을 통해 베이 즈 계수를 다시 계산하는 것보다 계산상의 이점이 없다는 견해에 동의합니다. 그럼에도 불구하고 이전 데이터 벡터의 한계 값을 다시 계산할 필요가 없다는 것을 알 수 있습니다. (대신 우리는 각 모델 클래스 아래에서 이전 데이터에 조건부로 새로운 데이터 포인트의 예측 밀도를 계산합니다.) 당신처럼,이 적분 공식이 쉽게 단순화되지 않는 한, 이것의 계산상의 이점은 실제로 보지 못합니다. 어쨌든 베이 즈 계수를 업데이트하기위한 또 다른 공식을 제공한다고 가정합니다.


감사합니다. 한계 값이 다시 계산 될 필요는 없으며, stricto sensu 이지만 계산량은 동일한 것으로 보입니다.
Xi'an

내가 생각할 수있는 유일한 장점은 밀도 의 곱이 아닌 단일 밀도에 대해서만 통합하기 때문에 적분이 덜 휘발성이어서이 후자의 공식을 통해 언더 플로 문제를 쉽게 피할 수 있다는 것입니다. 계산. 그래도 큰 일입니다. n
복원 Monica Monica
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.