나는 당신이 를 완전히 알려지지 않은 대상으로 취급한다고 생각 합니다. 나는 이것이 사실이라고 생각하지 않습니다. 이것은 아마도 당신이 놓친 것입니다.p
(iid) 을 관찰 하고 와 를 가정하는 를 추론하려고합니다. 는 모델에 의해 지정됩니다. 베이 즈의 법칙에 따라Y={yi}ni=1p(x|Y)p(y|x)p(x)x∈Rd
p(x|Y)=p(x)p(Y)p(Y|x)=p(x)p(Y)∏i=1np(yi|x).
첫 번째 관찰은 사후 분포 대해 알고 있다는 것 입니다. 위와 같이 주어집니다. 일반적으로 노멀 라이저 는 모릅니다 . 우도 가 매우 복잡하다면, 복잡한 분포 갖게 됩니다.p(x|Y)p(Y)p(y|x)p(x|Y)
변형 추론을 가능하게하는 두 번째 일은 가 취할 수 있는 형식에 제약이 있다는 것입니다 . 제약이 없다면, 는 가 될 수 있으며 일반적으로 다루기 어렵습니다. 일반적으로 는 지수 군의 선택된 부분 집합에있는 것으로 가정합니다. 예를 들어, 이것은 완전 인수 분해 가우시안 분포의 계열 일 수 있습니다. 즉 입니다. 이것이 제약 조건 세트라면 각 구성 요소는 다음과 같이 주어집니다.qargminqKL(p||q)pqq∈Q={∏di=1qi(xi)∣each qi is a one-dimensional Gaussian}q
qi∝exp(E∏j≠iqjlogp(x,Y)),
여기서정확한 공식은별로 중요하지 않습니다. 요점은 실제 에 대한 지식 과 대략적인 가 취해야 하는 형태의 가정에 의존 하여 대략적인 를 찾을 수 있다는 것입니다.p(x,Y)=p(x)∏ni=1p(yi|x).qpq
최신 정보
다음은 질문에서 업데이트 된 부분에 대한 답변입니다. 방금 대해 생각하고 있음을 깨달았습니다 . 항상 실제 수량으로 를 사용 하고 대략적인 수량으로 를 사용합니다. 변동 추론 또는 변동 베이에서 는KL(q||p(x|Y))pqq
q=argminq∈QKL(q||p(x|Y)).
위와 같이 제약 조건을 로 설정 하면 솔루션이 이전에 제공된 것입니다. 지금 생각하고 있다면Q
q=argminq∈QKL(p(x|Y)||q),
위한 지수 가족들의 서브셋으로 정의하고 이러한 추론이라고 기대 전파 (EP). 이 경우 에 대한 해는 모멘트가 의 모멘트와 일치하는 것입니다 .Qqp(x|Y)
어느 쪽이든, 당신은 본질적으로 어떤 형태를 취하기 위해 제한 된 분포 의해 KL 의미의 실제 후방 분포를 근사하려고한다고 말하는 것이 옳습니다 .q