정보 획득, 상호 정보 및 관련 조치


33

Andrew More 정보 획득을 다음과 같이 정의합니다 .

나는(와이|엑스)=H(와이)H(와이|엑스)

여기서 는 조건부 엔트로피 입니다. 그러나 Wikipedia는 위의 양 상호 정보를 호출합니다 .H(와이|엑스)

반면 Wikipedia는 정보 획득 을 두 개의 임의 변수 사이의 Kullback–Leibler 분기 (일명 정보 분기 또는 상대 엔트로피)로 정의합니다.

케이(||)=H(,)H()

여기서 는 교차 엔트로피 로 정의됩니다 .H(,)

이 두 정의는 서로 일치하지 않는 것 같습니다.

또한 다른 저자들이 두 가지 추가 관련 개념, 즉 차동 엔트로피와 상대 정보 획득에 대해 이야기하는 것을 보았습니다.

이 수량들 사이의 정확한 정의 또는 관계는 무엇입니까? 그들 모두를 다루는 좋은 교과서가 있습니까?

  • 정보 획득
  • 상호 정보
  • 교차 엔트로피
  • 조건부 엔트로피
  • 차동 엔트로피
  • 상대 정보 획득

2
혼란을 더하기 위해 교차 엔트로피에 사용 된 표기법도 관절 엔트로피에 사용 된 표기법과 동일합니다. 나는 혼동을 피하기 위해 교차 엔트로피에 를 사용했지만 그것은 내 이익을위한 것이며 다른 곳에서는 그 표기법을 본 적이 없다. H엑스(,)
Michael McGowan

답변:


24

Kullback-Leibler 발산을 "정보 게인"이라고 부르는 것은 비표준이라고 생각합니다.

첫 번째 정의는 표준입니다.

편집 : 그러나 는 상호 정보라고도 할 수 있습니다.H(와이)H(와이|엑스)

표준화되고 정확하며 일관된 명명 체계를 가진 과학적 규율을 찾을 수 없다고 생각합니다. 따라서 수식은 일반적으로 더 나은 아이디어를 제공하기 때문에 항상 수식을 살펴 봐야합니다.

교과서 : "다른 종류의 엔트로피에 대한 좋은 소개"를 참조하십시오 .

또한 : Cosma Shalizi : 복잡한 시스템 과학의 방법 및 기법 : Thomas S. Deisboeck의 1 장 (33--114 페이지) 및 생물 의학의 복잡한 시스템 과학 (J. Yasha Kresh) (eds.), http : // arxiv.org/abs/nlin.AO/0307015

Robert M. Gray : 엔트로피 및 정보 이론 http://ee.stanford.edu/~gray/it.html

David MacKay : 정보 이론, 추론 및 학습 알고리즘 http://www.inference.phy.cam.ac.uk/mackay/itila/book.html

또한 "엔트로피와 정보 획득"이란 무엇입니까? "


감사합니다 @wolf. 이 답변을 받아들이려고합니다. 첫 번째 정의가 표준이라면 상호 정보를 어떻게 정의 하시겠습니까?
Amelio Vazquez-Reina

2
죄송합니다. 제 1 수량, 는 종종 상호 정보라고도한다. 이름이 일치하지 않는 경우입니다. 내가 말했듯이, 나는 개념과 이름의 일관되고 모호하지 않은 일대일 대응이 없다고 생각합니다. 예를 들어 "상호 정보"또는 "정보 게인"은 KL 분기의 특별한 경우이므로 위키 백과 기사가 그리 멀지 않습니다. 나는(와이|엑스)=H(와이)H(와이|엑스)
wolf.rauch

4

와 사이의 Kullback-Leiber Divergence는 쉽게 도출 할 수있는 상호 정보와 동일합니다.(엑스,와이)(엑스)(와이)

나는(엑스;와이)=H(와이)H(와이엑스)=와이(와이)로그(와이)+엑스,와이(엑스)(와이엑스)로그(와이엑스)=엑스,와이(엑스,와이)로그(와이엑스)와이(엑스(엑스,와이))로그(와이)=엑스,와이(엑스,와이)로그(와이엑스)엑스,와이(엑스,와이)로그(와이)=엑스,와이(엑스,와이)로그(와이엑스)(와이)=엑스,와이(엑스,와이)로그(와이엑스)(엑스)(와이)(엑스)=엑스,와이(엑스,와이)로그(엑스,와이)(와이)(엑스)=케이((엑스,와이)∣∣(엑스)(와이))

참고 :(와이)=엑스(엑스,와이)


1

상호 정보는 Kullback-Liebler를 로 사용하여 정의 할 수 있습니다

나는(엑스;와이)=케이((엑스,와이)||(엑스)(와이)).

1

머신 러닝 모델을 훈련시키는 기능으로 텍스트 데이터 세트에서 상호 정보 추출

여기에 이미지 설명을 입력하십시오


1

두 정의 모두 정확하고 일관성이 있습니다. 설명이 필요한 여러 지점을 지적 할 때 명확하지 않은 부분이 무엇인지 잘 모르겠습니다.

나는에이나는에프영형아르 자형에이나는영형 나는나는에프영형아르 자형에이나는영형에이나는나는나는에프영형아르 자형에이나는영형같은 것에 대해 모두 다른 이름입니다. 다른 맥락에서 이러한 이름 중 하나가 바람직 할 수 있습니다 . 여기서는 Information 이라고 부릅니다 .

케이케이케이독립적 . 우리는 그 수량 정보 라고 부릅니다 .

H(엑스,와이)

H(엑스,와이)케이(||)=H(,)H()H(,)

공동 엔트로피와 교차 엔트로피는 동일 하지 않습니다 .

H()

이 표기법이 받아 들여지고 위키 페이지가 업데이트되기를 바랍니다.


방정식이 제대로 표시되지 않는 이유가 궁금합니다.
Shaohua Li
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.