Fisher 지표와 상대 엔트로피 간의 연결


20

누군가 순수하게 수학적으로 엄격한 방식으로 Fisher 정보 지표와 상대 엔트로피 (또는 KL 분기) 사이의 다음 연결을 증명할 수 있습니까 ?

D(p(,a+da)p(,a))=12gi,jdaidaj+(O(da3)
여기서 a=(a1,,an),da=(da1,,dan) ,
gi,j=i(logp(x;a))j(logp(x;a)) p(x;a) dx
gi,jdaidaj:=i,jgi,jdaidaj 는 아인슈타인 요약 규칙입니다.

Vasileios Anagnostopoulos가 코멘트에서 그것에 대해 말한 John Baez 의 멋진 블로그에서 위의 내용을 찾았습니다 .


1
Kumara님께 : 명확하게 말하면, 특히 g_ {i, j} 의 의미를 잘 설명하는 데 도움이됩니다 gi,j. 또한, 나는 당신의 표현이 디스플레이 방정식의 우변의 첫 번째 항 앞에서 1/2 의 상수 인자가 누락되었다고 생각합니다 1/2. Kullback 자신이 분기 라고 부른 것 ( J (\ cdot, \ cdot) 표기법 사용 J(,))은 KL 분기라고하는 알려진 버전의 대칭 버전입니다. 즉, J(p,q)=D(pq)+D(qp) . KL 발산은 Kullback의 글에서 I(,) 되었습니다. 이것은 1/2 의 요소도 설명합니다 1/2. 건배.
추기경

답변:


19

1946 년 지구 물리학 자와 베이지안 통계학자인 Harold Jeffreys는 오늘날 우리가 쿨백-레 블러 발산이라고 부르는 것을 소개했으며, "무한히 가까운"두 분포에 대해 발견했습니다. Kullback-Leibler 분기는 Fisher 정보 매트릭스의 요소에 의해 계수가 제공되는 2 차 형태로 나타납니다. 그는이 2 차 형태를 Riemannian 매니 폴드의 길이 요소로 해석했으며 Fisher 정보는 Riemannian 메트릭의 역할을합니다. 통계 모델의 이러한 형상화에서, 그는 Jeffreys의 사전을 Riemannian 메트릭에 의해 자연적으로 유도 된 측정 값으로 도출했으며,이 측정 값은 매니 폴드에 본질적으로 균일 한 분포로 해석 될 수 있지만 일반적으로 유한 측정 값은 아닙니다.

엄격한 증거를 작성하려면 모든 확장 성 조건을 확인하고 Taylor 확장에서 오류 용어의 순서를 처리해야합니다. 다음은 인수에 대한 간단한 스케치입니다.

두 밀도 와 사이의 대칭 쿨백-레 블러 발산 은 다음과 같이 정의됩니다.fg

D[f,g]=(f(x)g(x))log(f(x)g(x))dx.

우리는에 의해 파라미터 밀도의 가족이있는 경우 다음θ=(θ1,,θk)

D[p(θ),p(θ+Δθ)]=(p(x,θ)p(xθ+Δθ))log(p(xθ)p(xθ+Δθ))dx,
여기서 입니다. 표기법을 소개하면 일부 대수는 자연 로그에 Taylor 확장을 사용하면 Δθ=(Δθ1,,Δθk)
Δp(xθ)=p(xθ)p(xθ+Δθ),
[(θ),(θ+Δθ)]=Δ(엑스θ)(엑스θ)로그(1+Δ(엑스θ)(엑스θ))(엑스θ)엑스.
로그(1+Δ(엑스θ)(엑스θ))Δ(엑스θ)(엑스θ),
D [ 따라서 그러나 따라서 있는
[(θ),(θ+Δθ)](Δ(엑스θ)(엑스θ))2(엑스θ)엑스.
Δ(엑스θ)(엑스θ)1(엑스θ)나는=1케이(엑스θ)θ나는Δθ나는=나는=1케이로그(엑스θ)θ나는Δθ나는.
[(θ),(θ+Δθ)]나는,j=1케이나는jΔθ나는Δθj,
나는j=로그(엑스θ)θ나는로그(엑스θ)θj(엑스θ)엑스.

이것은 원본 용지입니다.

제프리, H. (1946). 추정 문제의 사전 확률에 대한 변하지 않는 형태. Proc. 로얄 삭스 런던, 시리즈 A, 186, 453–461.


1
좋은 글을 보내 주셔서 감사합니다. 이것을 도울 수 있다면 좋을 것입니다.
Kumara

예, 당신은 올바르게 말했다. 이 "추상 함정"에서 나와야합니다.
Kumara

@zen 정수 아래에서 Taylor의 로그 확장을 사용하는 이유는 무엇입니까?
Sus20200

1
표준 KL 분기와 달리 대칭형 KL 분기부터 시작하는 것이 중요합니다. Wikipedia 기사에는 대칭 버전에 대한 언급이 없으므로 잘못되었을 수 있습니다. en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
외과 사령관

11

일반적인 (비대칭) KL 발산에 대한 증거

Zen의 대답은 대칭 KL 발산을 사용하지만 결과는 무한히 가까운 분포에 대해 대칭이되기 때문에 일반적인 형태에도 적용됩니다.

다음은 스칼라 (게으 르기 때문에)로 매개 변수화 된 불연속 분포에 대한 증거 이지만 연속 분포 또는 매개 변수 벡터에 대해 쉽게 다시 작성할 수 있습니다.θ

= p θ log p θp θ log p θ = 0d θ p θ d

(θ,θ+θ)=θ로그θθ로그θ+θ .
마지막 용어 확장 : 일부 규칙 성을 가정하면 두 가지 결과를 사용했습니다.
=θ로그θθ로그θ= 0θθθ로그θ= 0 12θ2θ2θ2로그θ=θ(θ로그θ)2 +영형(θ)=12θ2θ(θ로그θ)2피셔 정보+영형(θ).
:θθ로그θ=θθ=θθ=0,

:θ2θ2로그θ=θθ(1θθθ)=θ[1θ2θθ(1θθθ)2]=2θθ2θ(1θθθ)2=2θ2θ= 0θ(θ로그θ)2.

4

다음 논문의 식 (3)에서 유사한 관계 (1 차원 매개 변수)를 찾을 수 있습니다.

D. Guo (2009), 상대 엔트로피 및 점수 함수 : Proc. 에서 임의의 추가 섭동을 통한 새로운 정보-추정 관계 . 정보 이론에 관한 IEEE 국제 심포지엄 , 814–818. ( 안정적인 링크 ).

저자는

S. 쿨백, 정보 이론 및 통계 . 뉴욕 : 1968 년 도버.

이 결과의 증거.


1
이 논문의 다변량 버전의 방정식 (3)은 27-28 페이지에 인용 된 Kullback 텍스트에서 입증되었습니다. OP의 질문에서 상수 이 사라진 것 같습니다. :)1/2
추기경
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.