두 개의 일 변량 가우스 간의 KL 분기


79

두 가우스 간의 KL- 분산을 결정해야합니다. 나는 내 결과를 비교하고 있지만, 나는 그들의 결과를 재현 할 수 없습니다. KL (p, p)에 대해 KL이 0이 아니기 때문에 결과가 분명히 잘못되었습니다.

어디에서 실수를하는지 궁금해하고 누군가가 실수를 할 수 있는지 물어 봅니다.

하자 및 . 주교의 PRML에서 나는p(x)=N(μ1,σ1)q(x)=N(μ2,σ2)

케이(,)=(엑스)로그(엑스)엑스+(엑스)로그(엑스)엑스

모든 실제 라인에서 통합이 이루어지고

(엑스)로그(엑스)엑스=12(1+로그2πσ12),

그래서 나는 스스로를 로 제한합니다.(엑스)로그(엑스)엑스

(엑스)로그1(2πσ22)(1/2)이자형(엑스μ2)22σ22엑스,

그것은 분리 될 수있다

12로그(2πσ22)(엑스)로그이자형(엑스μ2)22σ22엑스.

내가 얻는 로그를 복용

12로그(2πσ22)(엑스)((엑스μ2)22σ22)엑스,

여기서 합계를 분리 하고 적분에서 σ22 얻습니다 .

12로그(2πσ22)+(엑스)엑스2엑스(엑스)2엑스μ2엑스+(엑스)μ22엑스2σ22

분들께 아래의 기대 연산자 나타내는 , 나는대로이를 다시 작성할 수 있습니다p

12log(2πσ22)+x22xμ2+μ222σ22.

우리는 알고 . 그러므로var(x)=x2x2

x2=σ12+μ12

따라서

12log(2πσ2)+σ12+μ122μ1μ2+μ222σ22,

내가 넣을 수있는

12log(2πσ22)+σ12+(μ1μ2)22σ22.

모든 것을 하나로 모아서

케이(,)=(엑스)로그(엑스)엑스+(엑스)로그(엑스)엑스=12로그(2πσ22)+σ12+(μ1μ2)22σ2212(1+로그2πσ12)=로그σ2σ1+σ12+(μ1μ2)22σ22.
1 두 개의 동일한 가우시안에 대해 과 같기 때문에 잘못되었습니다 .1

누구든지 내 오류를 발견 할 수 있습니까?

최신 정보

정리를 해준 mpiktas에게 감사합니다. 정답은 다음과 같습니다.

케이(,)=로그σ2σ1+σ12+(μ1μ2)22σ2212


처음에 잘못된 답변을 게시 해 주셔서 감사합니다. 방금 보고 즉시 적분이 0이라고 생각했습니다. 그것이 제곱되었다는 요점은 내 마음을 완전히 놓쳤다 :)xμ1
mpiktas

다변량 사례는 어떻습니까?

연구 논문에서 kld는 $ KL (p, q) = ½ * ((μ₁-μ₂) ² + σ₁² + σ₂²) * ((1 / σ₁²) + (1 / σ₂²))-2
skyde

1
귀하의 질문에 오타가 있다고 생각합니다. 왜냐하면 그것을 확인할 수 없으며 나중에 질문에서 올바른 버전을 사용한 것 같습니다. 다음과 같아야한다고 생각합니다 (빼기 참고). 귀하의 질문을 수정하려고했으나 금지되어 있으므로 직접 해보십시오. ∫을P(X)로그P(X)(D)X=-1
(엑스)로그(엑스)엑스=12(1+로그2πσ12)
(엑스)로그(엑스)엑스=12(1+로그2πσ12)
y-spreen

답은 1996 년 내재적 손실에 관한 논문 에도 있습니다 .
시안

답변:


59

알았어. 오류는 마지막 방정식에 있습니다.

케이(,)=(엑스)로그(엑스)엑스+(엑스)로그(엑스)엑스=12로그(2πσ22)+σ12+(μ1μ2)22σ2212(1+로그2πσ12)=로그σ2σ1+σ12+(μ1μ2)22σ2212

누락 된 유의하십시오 . 및 때 마지막 줄은 0이됩니다 . μ1=μ2σ1=σ212μ1=μ2σ1=σ2


@mpiktas 나는 그 질문을 정말로 의미했다.-bayerj 잘 알려진 연구원이고 나는 학부생이다. 똑똑한 사람들조차도 가끔 인터넷에서
묻는다.

3
p 또는μ 2 σ 2μ1σ1μ2σ2
Kong

@Kong p는 질문에 명시된 바와 같이 입니다. (1,σ1)
zplizzi

31

나는 당신의 계산을 보지 못했지만 여기에 많은 세부 사항이 있습니다. 가정하자 평균이 정상 확률 변수의 밀도 과 분산 , 그리고 평균이 정상 확률 변수의 밀도 과 분산 . 에서 까지의 Kullback-Leibler 거리는 다음과 같습니다.μ1σ12μ2σ22

[로그((엑스))영형((엑스))](엑스)엑스

=[12로그(2π)로그(σ1)12(엑스μ1σ1)2+12로그(2π)+로그(σ2)+12(엑스μ2σ2)2] ×12πσ1특급[12(엑스μ1σ1)2]엑스

={로그(σ2σ1)+12[(엑스μ2σ2)2(엑스μ1σ1)2]} ×12πσ1특급[12(엑스μ1σ1)2]엑스

=이자형1{로그(σ2σ1)+12[(엑스μ2σ2)2(엑스μ1σ1)2]}

=로그(σ2σ1)+12σ22이자형1{(엑스μ2)2}12σ12이자형1{(엑스μ1)2}

=로그(σ2σ1)+12σ22이자형1{(엑스μ2)2}12

( )(엑스μ2)2=(엑스μ1+μ1μ2)2=(엑스μ1)2+2(엑스μ1)(μ1μ2)+(μ1μ2)2

=로그(σ2σ1)+12σ22[이자형1{(엑스μ1)2}+2(μ1μ2)이자형1{엑스μ1}+(μ1μ2)2]12

=로그(σ2σ1)+σ12+(μ1μ2)22σ2212

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.