점별 상호 정보에 대한 경계가 주어진 경계 상호 정보


18

두 세트의 XY 있고 이러한 세트 대한 결합 확률 분포 가 있다고 가정 합니다 p(x,y). 하자 p(x)p(y) 위에 한계 분포 나타내는 XY 각각있다.

X 사이의 상호 정보 Y는 다음 과 같이 정의됩니다 :

I(X;Y)=x,yp(x,y)log(p(x,y)p(x)p(y))

즉, 이는 포인트 별 상호 정보 pmi ( x , y ) log ( p ( x , y ) 의 평균값입니다.(x,y)log(p(x,y)p(x)p(y)) .

pmi 상한과 하한을 알고 있다고 가정합니다 . 즉 , 모든 x 에 대해 y 는 다음을 보유 한다는 것을 알고 있습니다. k log ( p ( x , y )(x,y)x,y

klog(p(x,y)p(x)p(y))k

이것의 상한은 합니다. 물론 그것은 I ( X ; Y ) k 을 의미하지만 가능하면 더 엄격한 경계를 원합니다. p가 확률 분포를 정의하고 pmi ( x , y )xy 의 모든 값에 대해 최대 값을 가질 수 없거나 음수가 아닐 수도 있기 때문에 이것은 그럴듯 해 보입니다 .I(X;Y)I(X;Y)k(x,y)xy


1
관절 확률과 한계 확률이 균일하면 pmi ( , y )는 균일하게 0이므로 음수가 아니므로 마지막 진술과 모순되지만 간신히 나타납니다. 내가 실수하지 않은 경우, X × Y 의 작은 하위 집합에 대해이 상황을 혼란스럽게하는 것은 pmi의 경계가 I ( X ; Y ) 자체에 대해 거의 아무것도 말하지 않는다는 것을 나타냅니다 . xyX×YI(X;Y)
whuber

1
실제로 Y 가 독립적이면 한계 분포에 관계없이 p m i ( x , y ) 는 일정합니다. 따라서 p m i ( x , y ) 가 모든 xy에 대한 최대 값을 얻는 전체 분포 클래스 p ( x , y ) 가 있습니다. XYpmi(x,y)p(x,y)pmi(x,y)xy
추기경

예, pmi 가 모든 xy에 대해 같을 수는 있지만, 더 엄격한 범위를 배제하지는 않습니다. 예를 들어, 증명 어려운 아니라고 I ( X , Y ) K ( E K - 1 ) . 이다 K 2 경우 K < 1 및 상기 바인딩의 비 단순 강화 인 K K < 1 . 더 일반적으로 적용되는 사소한 경계가 있는지 궁금합니다.(x,y)xyI(X;Y)k(ek1)k2k<1kk<1
플로리안

1
k 0에 대해 보다 더 나은 경계를 갖게 될 것 같습니다 . 더 어려워 보이고 싶다면 p (x) p (y)와 p (x, y) 사이의 KL 차이 측면에서 질문을 재구성하십시오. Pinsker의 불평등은 MI의 하한을 제공하여 직감을 확인할 수 있습니다. ajmaa.org/RGMIA/papers/v2n4/relog.pdf의 섹션 4도 참조하십시오 . O(k2)k0
vqv

답변:


5

나의 공헌은 예입니다. 포인트 별 상호 정보에 대한 경계가 주어지면 상호 정보가 어떻게 제한 될 수 있는지에 대한 몇 가지 한계를 보여줍니다.

모든 x X에 대해 p ( x ) = 1 / n 을 취하십시오 . 임의의 경우 m { 1 , ... , N / 2 } 하자 K > 0 방정식의 해결책 일 수 m의 전자 K + ( N - M ) E - K = N .X=Y={1,,n}p(x)=1/nxXm{1,,n/2}k>0

mek+(nm)ek=n.
그럼 장소 지점 질량 에서 n 개의 m의 제품 공간에서 포인트 { 1 , ... , N } (2) 이되는 방식으로 m 의 각 행과 각 열에 이러한 점. (여러 가지 방법으로 수행 할 수 있습니다. 예를 들어, 첫 번째 행에서 첫 번째 m 포인트로 시작한 다음 각 행에 대해 주기적 경계 조건으로 m 포인트를 오른쪽으로 이동하여 나머지 행을 채 웁니다 ). 우리는 점 질량 배치 전자 - K / N (2) (가) 나머지에 2ek/n2nm{1,,n}2mmmek/n2 포인트. 이 점 질량의 합은 n m입니다n2nm 그들은 확률 측정치를 제공되도록. 모든 한계점 확률은 m
nmn2ek+n2nmn2ek=mek+(nm)ekn=1,
이렇게 두 한계 분포가 균일하다.
mn2ek+mnn2ek=1n,

구조상 아무것도 없는지 모든 X , Y { 1 , ... , N } , 및 (어떤 계산 후) I ( X , Y ) = k n mpmi(x,y){k,k},x,y{1,,n}

I(X;Y)=knmn2ekkn2nmn2ek=k(1ekekek(ek+ek)ek),
k2/2k0kk


1

I'm not sure if this is what you are looking for, as it is mostly algebraic and not really leveraging the properties of p being a probability distribution, but here is something you can try.

Due to the bounds on pmi, clearly p(x,y)p(x)p(y)ek and thus p(x,y)p(x)p(y)ek. We can substitute for p(x,y) in I(X;Y) to get I(X;Y)x,yp(x)p(y)eklog(p(x)p(y)ekp(x)p(y))=x,yp(x)p(y)ekk

I'm not sure if that's helpful or not.

EDIT: Upon further review I believe this is actually less useful than the original upper bound of k. I won't delete this though in case it might hint at a starting point.


The value of this bound becomes apparent after you note x,yp(x)p(y)=1 and (since k0) that ek1.
whuber

Yes, when I realized that I made my edit.
Michael McGowan
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.