KL 발산이 왜 음이 아닌가?


18

KL 발산이 왜 음이 아닌가?

정보 이론의 관점에서 나는 다음과 같은 직관적 인 이해를 얻었습니다.

x로 레이블이 지정된 동일한 요소 세트로 구성된 두 개의 앙상블 A 가 있다고 가정하십시오 . p ( x )q ( x ) 는 각각 앙상블 AB에 대한 서로 다른 확률 분포 입니다.Bxp(x)q(x)AB

정보 이론의 관점에서 는 앙상블 A에 대한 요소 x 를 기록하는 데 필요한 최소 비트 수입니다 . 따라서 기대 x e n s e m b l e - p ( x ) ln ( p ( x ) ) 는 최소한 A 요소 를 평균적으로 기록하는 데 필요한 비트 수로 해석 될 수 있습니다 .log2(P(x))xA

xensemblep(x)ln(p(x))
A

이 공식은 우리가 평균적으로 필요한 비트에 하한을두기 때문에 다른 확률 분포 q ( x ) 를 일으키는 다른 앙상블 경우 각 요소 x 에 대해 주어진 경계 는 반드시 비트가 아닙니다. p ( x )로 주어짐에 따라, 기대를 취하는 것은Bq(x)xp(x)

xensemblep(x)ln(q(x))
이 평균 길이는 반드시 이전 길이보다 길어
p(x)q(x)가 다르기때문에 여기 에≥를넣지 않습니다.
xensemblep(x)ln(p(x))ln(q(x))>0
p(x)q(x)

이것은 나의 직관적 인 이해입니다. KL 발산이 음이 아닌 것을 증명하는 순수한 수학적 방법이 있습니까? 문제는 다음과 같이 말할 수 있습니다.

주어진 q ( x ) 는 모두 실선에 대해 양수이며 + p ( x ) d x = 1 , + q ( x ) d x = 1 입니다. 증명 + p ( x ) ln p ( x )p(x)q(x)+p(x)dx=1+q(x)dx=1 는 음이 아닙니다.

+p(x)lnp(x)q(x)

이것이 어떻게 증명 될 수 있습니까? 아니면 추가 조건없이 증명할 수 있습니까?


1
Fano의 불평등 의 증거를 이해하면 상대 엔트로피의 비 음성을 쉽게 도출 있습니다.
Lerner Zhang

답변:


30

증명 1 :

lnaa1a>0

DKL(p||q)0DKL(p||q)0

D(p||q)=xp(x)lnp(x)q(x)=xp(x)lnq(x)p(x)(a)xp(x)(q(x)p(x)1)=xq(x)xp(x)=11=0

For inequality (a) we used the ln inequality explained in the beginning.

Alternatively you can start with Gibbs' inequality which states:

xp(x)log2p(x)xp(x)log2q(x)

Then if we bring the left term to the right we get:

xp(x)log2p(x)xp(x)log2q(x)0xp(x)log2p(x)q(x)0

The reason I am not including this as a separate proof is because if you were to ask me to prove Gibbs' inequality, I would have to start from the non-negativity of KL divergence and do the same proof from the top.


Proof 2: We use the Log sum inequality:

i=1nailog2aibi(i=1nai)log2i=1naii=1nbi

Then we can show that DKL(p||q)0:

D(p||q)=xp(x)log2p(x)q(x)(b)(xp(x))log2xp(x)xq(x)=1log211=0

where we have used the Log sum inequality at (b).


Proof 3:

(Taken from the book "Elements of Information Theory" by Thomas M. Cover and Joy A. Thomas)

D(p||q)=xp(x)log2p(x)q(x)=xp(x)log2q(x)p(x)(c)log2xp(x)q(x)p(x)=log21=0

where at (c) we have used Jensen's inequality and the fact that log is a concave function.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.