정보 이론 중심 한계 정리


11

정보 이론 CLT의 가장 간단한 형태는 다음과 같습니다.

하자 , 평균 IID 수 이고 분산이 . 하자 정규화 된 합계 농도 될 와 표준 가우시안 밀도 될. 그런 다음 정보 이론적 CLT는 만약 가 대해 유한 하면 으로 냅니다. .0 1 f n n i = 1 X iX1,X2,01fni=1nXinϕD(fnϕ)=fnlog(fn/ϕ)dxnD(fnϕ)0n

확실히이 수렴은 문학에서 잘 확립 된 수렴, L_1 미터법의 분포 및 수렴 수렴 L1, Pinsker의 불평등으로 인해 "강하다" (|fnϕ|)22fnlog(fn/ϕ) . 즉, KL- 분산에서의 수렴은 L_1L1 거리 에서의 분포 및 수렴에서의 수렴을 의미한다 .

두 가지를 알고 싶습니다.

  1. 결과 D (f_n \ | \ phi) \ to 0에 대해 너무 좋은 점은 무엇입니까 D(fnϕ)0?

  2. 우리가 KL- 분산에서의 수렴 ( , D(fnϕ)0 )이 더 강 하다고 말하는 세 번째 단락에 언급 된 이유 때문 입니까?

NB : 언젠가 math.stackexchange에서이 질문을했는데 답을 얻지 못했습니다.


중복 된 math.SE 질문에 대한 링크를 제공하십시오.
추기경

6
귀하의 진술은 (레 베스 법안과 관련하여) 밀도의 존재를 암시 적으로 가정하는 것 같습니다. 당신이에 관심이있을 수 짧고 즐거운 용지 : AR 배런 (1986), 엔트로피와 중심 극한 정리 앤. 프로 밥. 14 권 1, 336-342. ( 오픈 액세스 ).
추기경

2
나는 그 논문을 이미 보았다. 그는 1 페이지의 두 번째 단락에서 정보 이론적 관점에서 동기를 부여했습니다. 그 당시에는 나에게 분명하지 않았습니다. 이제 괜찮아 보입니다. 그럼에도 불구하고 다음을 명확하게 설명하고 답변으로 게시 할 수 있다면 좋을 것입니다. "정보 이론으로부터, 상대 엔트로피 ( 는 으로부터의 샘플의 양자화를 기술 할 때 정규 분포에 기초한 섀넌 코드의 리던던시 (초과 평균 설명 길이)에 대한 최소 상한 이다." 나는 거기에 아무도 유치하지 않았기 때문에 math.SE에서 그 질문을 삭제했습니다Dnfn
Ashok

@ cardinal : 좋은 종이를위한 tks.
Zen

답변:


5

이 정리에서 가장 좋은 점은 일반적인 중앙 제한 정리가 적용되지 않는 일부 설정에서 제한 정리를 제안한다는 것입니다. 예를 들어, 최대 엔트로피 분포가 원의 분포와 같은 비정규 분포 인 상황에서는 균일 한 분포로 수렴하는 것이 좋습니다.


이해가 안 돼요 이미 언급했듯이 KL 분기의 수렴은 분포의 수렴을 의미합니다. 따라서 정보 이론적 CLT가 적용되는 곳마다 일반적인 CLT도 적용됩니다. 또한 정보 이론 CLT는 유한 분산도 가정합니다. 아니면 뭔가 빠졌습니까?
Ashok

2
내가 의미하는 것은 엔트로피 방법이 한계가 정규 분포가 아닌 상황에서 한계가 무엇인지 제안한다는 것입니다. 그런 다음 한계는 엔트로피를 최대화하는 분포입니다.
kjetil b halvorsen 10

3

주변을 둘러 본 후 상대 엔트로피에 수렴이없는 분포의 수렴에 대한 예를 찾을 수 없으므로 결과의 "위대함"을 측정하기가 어렵습니다.

나 에게이 결과는 단순히 회선 제품의 상대 엔트로피를 설명하는 것처럼 보입니다. 그것은 종종 중앙 제한 정리의 대안 적 해석 및 증거 틀로 여겨지며, 비록 그것이 정보 이론에도 불구하고 확률 이론에 직접적인 영향을 미친다는 것을 확신하지 못한다.

에서 정보 이론과 중심 극한 정리 (19 페이지).

열역학 제 2 법칙에 따르면 열역학 엔트로피는 항상 시간이 지남에 따라 증가하므로 깁스 상태로 수렴하는 것을 의미합니다. 에너지 보존은 이 시간 진화 동안 가 일정하게 유지됨을 의미 하므로, 처음부터 어떤 Gibbs 상태가 한계인지 알 수 있습니다. 우리는 컨볼 루션을 수행 할 때 정보 이론 엔트로피가 최대로 증가하여 가우스에 대한 수렴을 암시함으로써 중앙 한계 정리를 동일한 방식으로 고려할 것입니다. 적절하게 정규화한다는 것은 컨벌루션 동안 분산이 일정하게 유지되므로 처음부터 어느 가우시안이 한계인지 알 수 있습니다.E


2
가 이산 분포를 가지고 CLT가 적용될 때마다 상대 엔트로피에 수렴이없는 분포에 수렴의 예가 많이 있습니다 . Xi
Mark Meckes

1

D(fnϕ)0 은 랜덤 변수의 합의 분포와 가우스 밀도 사이 에 KL 발산의 정의 때문에 로 "거리"가 없음을 보증 하므로 증거 그 자체. 아마도 당신의 질문을 오해했을 것입니다.n

당신이 임명 한 두 번째 요점에 관해서는, 그것은 당신의 단락에서 응답합니다.


1
정규 (린드버그) CLT는 표본 평균이 정규 RV에 분포로 수렴 함을 나타냅니다. 이는 CDF가 지점으로 수렴 함을 의미합니다 . 여기에 귀하의 답변에 반영되지 않은 OP 결과와 미묘한 측정 이론 차이가 있습니다. Φ
AdamO
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.