차동 엔트로피


13

가우스 RV의 차동 엔트로피는 입니다. 이것은 표준 편차 인 에 의존합니다 .σlog2(σ2πe)σ

랜덤 변수를 정규화하면 단위 분산을 가지므로 차분 엔트로피가 떨어집니다. 나에게 이것은 정규화 상수의 Kolmogorov 복잡성이 엔트로피의 감소에 비해 매우 작아야하기 때문에 반 직관적입니다. 이 랜덤 변수에 의해 생성 된 임의의 데이터 세트를 복구하기 위해 정규화 상수로 분할 / 다중화하는 인코더 디코더를 간단하게 고안 할 수있다.

아마 내 이해가 꺼져있을 것입니다. 내 결함을 지적 해 주시겠습니까?

답변:


17

나는 머리 위로 조금 있지만 이것에 가야 할 것이므로 소금을 뿌려 처리하십시오 ...

당신은 정확히 틀리지 않습니다. 나는 당신의 생각 실험이 떨어지는 곳에서 차동 엔트로피가 엔트로피의 제한적인 사례가 아니라고 생각합니다. 나는 이것 때문에 그것과 Kolmogorov의 복잡성 사이의 유사성이 없어진다고 추측합니다.

불연속 랜덤 변수 가 있다고 가정 해 봅시다 . 가능한 모든 값 , 을 합하여 다음과 같이 Shannon 엔트로피를 계산할 수 있습니다Xxi

H(X)=iP(X=xi)log(P(X=xi)).

지금까지 지루한. 이제 가 연속 랜덤 변수의 정량화 된 버전 이라고 가정 해 봅시다. 예를 들어 밀도 함수 가 실수 세트에서 샘플을 생성하고 이것을 히스토그램으로 바꿉니다. 밀도 함수가 본질적으로 선형 일 정도로 충분히 히스토그램을 갖습니다. 이 경우 엔트로피를 가질 것입니다. 곳 우리 히스토그램 빈들의 폭과 각각의 중점이다. 우리는 그 로그 안에 곱을 가지고 있습니다-그것을 분리하고 1에 합산되는 확률 분포의 속성을 사용하여 그것을 합산 밖으로 옮기십시오. Xp()

H(X)ip(X=xi)δxlog(p(X=xi)δx),
δxxi
H(X)log(δx)ip(X=xi)δxlog(p(X=xi)).

우리가 한계를 취하여 하고 합산을 적분으로 근사값이 정확 해지며 δxdx

H(X)=log(dx)xp(X=x)log(p(X=x))dx.

오른쪽의 용어는 차동 엔트로피입니다. 그러나 그 끔찍한 용어를보십시오. 우리는 모든 답변이 NaN이되지 않도록 무시해야합니다. 차분 엔트로피가 Shannon 엔트로피의 제한적인 사례가 아니라는 것을 두려워합니다.log(dx)

따라서 일부 속성이 손실됩니다. 예, 데이터 크기를 조정하면 차등 엔트로피가 변경됩니다. 차등 엔트로피는 pdf가 얼마나 '밀폐 포장'되어 있는지 측정 한 것입니다. 크기를 조정하면 변경됩니다. 또 다른 재미있는 속성은 Shannon 엔트로피와 달리 음수가 될 수 있다는 것입니다. 정말로 작게 설정 하고 무슨 일이 일어나는지보십시오. Kolmogorov의 복잡성과의 관련성을 잃어버린 것은 또 다른 사상 자라고 생각합니다.σ

다행히도 우리는 완전히 길을 잃지 않았습니다. Kullback–Leibler은 서로의 정보가 다양하고 모두 취소 되면 상호 정보가 상당히 잘 동작 합니다. 예를 들어, 여기서 는 참조 분포입니다 -균일 한 것. 이것은 항상 양수이며 변수 크기를 조정하면 및 가 모두 변경 되므로 결과가 훨씬 덜 심각합니다.δ

xp(X=x)log(p(X=x)q(X=x))dx
q(X)Xp(X)q(X)

감사. 매우 흥미 롭습니다. 나는 이론에 그런 특수 효과가 있다는 것을 몰랐다.
Cagdas Ozgenc

1
표기법 은 그다지 의미가 없지만 표현의 일부를 좀 더 정확한 것으로 바꿀 수 있습니다. 실제로 밀도 가 Riemann 통합 가능하면 는 입니다. 이것에 대한 해석은 연속 랜덤 변수의 비트 양자화가 약 엔트로피를 갖는다는 것 입니다. p ( x ) i p ( x i ) δ x log p ( x i ) h ( X ) δ x 0 n h ( X ) + nlog(dx)p(x)ip(xi)δxlogp(xi)h(X)δx0nh(X)+n
추기경

1
@추기경. 그래, 나는 가 내가 쓸 때 이야기하는 것이 끔찍한 일 이라는 것을 알았다 . 그러나 나는 이런 식으로 그것에 대해 가면 차분 엔트로피가 실제로 엔트로피가 아닌 이유를 실제로 몰아 낼 수 있다고 생각합니다. log(dx)
Pat

@Cagdas-나는 그것을 특수 효과라고 부르면 몰라. 그것은 단지 다른 것을 측정하고 있습니다. 그리고 추기경이 지적했듯이 몇 가지 용도가 있습니다. 이항 분포에 적용 할 때 깨질 지 여부는 적용 방법에 달려 있습니다. :). 확실하지 않은 경우 새 주제를 시작할 가치가 있습니다.
Pat

나는 의사 난수 생성기를 고려할 때 엔트로피가 Kolmogorov의 복잡성과 분명히 다르다고 생각했습니다.
James Bowery
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.