베이지안 후부가 KL 발산의 최소량에 집중하는 이유는 무엇입니까?


9

베이지안 후부 고려하십시오 . 무조건 최대 값은 MLE 추정값 에서 발생하며 , 이는 가능성 최대화합니다 .θ엑스θ^아르 민θ에프θ(엑스)

이 모든 개념들-베이어 이전의 가능성을 극대화하는 것은 전혀 임의적 인 것이 아니라 매우 원칙적으로 들린다. 로그인이 없습니다.

그러나 MLE은 실제 분포 와 사이의 KL 발산을 최소화합니다 . 즉,에프~에프θ(엑스)

케이(에프~에프θ)=+에프~(엑스)[로그에프~(엑스)로그에프θ(엑스)]엑스

우와 —이 통나무는 어디에서 왔습니까? 특히 KL 분기가 필요한 이유는 무엇입니까?

예를 들어, 왜 다른 발산을 최소화하는 것이 베이지안 후부의 초 원리적이고 동기 부여 된 개념과 일치하지 않고 위의 가능성을 최대화 하는가?

이 맥락에서 KL 분기 및 / 또는 로그에 특별한 것이있는 것 같습니다. 물론, 우리는 공중에 손을 던질 수 있고 그것이 수학의 방식이라고 말할 수 있습니다. 그러나 나는 더 깊은 직관이나 폭로가 있을지도 모른다고 생각합니다.


당신은 여기에 몇 가지 아이디어를 찾을 수 있습니다 : stats.stackexchange.com/questions/188903/…
kjetil b halvorsen

@kjetilbhalvorsen 이전 제목은 중복 된 것 같았습니다. 나는 사과. 편집 한 결과이 질문이 중복되지 않은 이유가 분명해야합니다.
Yatharth Agarwal

다른 질문은“KL 발산이란 무엇이며 왜 대칭이 아닌가?”입니다. 답은 분기의 개념과 KL에 대한 일부 정보를 설명합니다. 대조적으로,이 질문은 왜 베이지안 후부는 KL 발산의 최소화에 집중 하는가? 분기가 어떻게 대칭이 될 필요가없고 KL을 설명하고 KL이 MLE에 연결되어 있다고 설명하는 것은 여기서 문제의 요점을 해결하지 못합니다. 왜 많은 가능한 분기 중에서 KL이 특히 베이지안 후부와 특별한 관련이 있습니까? 이게 말이 되요?
Yatharth Agarwal 1

그렇습니다.하지만 여전히 문제가 있습니다. 후부는 또한 이전에 의존하고, 그것이 강한 경우, 후부는 칸으로부터 최대 거리를 가질 수 있습니다. 그러나 귀하의 질문에는 이전이 없습니다.
kjetil b halvorsen

@kjetilbhalversen 나는 점점 더 많은 IID 샘플과 무조건적으로 이전 조건이 무의미하지 않은 (엄격한) 조건에서 무증상을 의미했습니다!
Yatharth Agarwal

답변:


5

이와 같은 계산에서 로그의 사용은 정보 이론 에서 비롯됩니다 . KL 분기의 특별한 경우, 측정 값은 두 분포의 상대 정보로 해석 될 수 있습니다.

케이(에프~에프θ)=에프~(엑스)(로그에프~(엑스)로그에프θ(엑스)) 엑스=(에프~(엑스)로그에프θ(엑스) 엑스H(에프~,에프θ))(에프~(엑스)로그에프~(엑스) 엑스H(에프~)),

여기서 은 IS 엔트로피 의 및 상기 교차 엔트로피 와 . 엔트로피는 밀도에 의해 생성 된 평균 속도의 척도로 간주 될 수 있습니다 (교차 엔트로피는 좀 더 복잡하다고 생각합니다). 고정 값 대한 KL 발산을 최소화하는 것은 (앞서 언급 한 문제에서와 같이) 교차 엔트로피를 최소화하는 것과 동일하므로이 최적화는 정보 이론적 해석을 제공 할 수 있습니다.H(에프~)에프~H(에프~,에프θ)에프~에프θ에프~

짧은 포스트에서 정보 이론과 정보 측정의 속성을 잘 설명 할 수는 없습니다. 그러나 통계와 밀접한 관련이 있으므로 필드를 살펴 보는 것이 좋습니다. 밀도의 로그에 대한 적분과 합을 포함하는 많은 통계 측정은 측정 이론에 사용되는 표준 정보 측정의 간단한 조합이며, 이러한 경우 다양한 밀도 등의 기본 정보 수준에 대한 해석을 제공 할 수 있습니다.


정보 이론을 살펴보면 유망한 것 같습니다! 그것을 지적 해 주셔서 감사합니다.
Yatharth Agarwal

분명히 StackExchange 게시물에서 전체 수학 필드를 설명 할 수는 없지만 로그가 표시되는 특정 참조가 있습니까?
Yatharth Agarwal 1

나는 왜 e가 오일러의 방정식에 있고, 여기에 숨어있는 비슷한 직관이 있다는 이유 뒤에 깊은 직관이 있다고 생각합니다. 어딘가에있는 제품이 자연 로그를 생성 할 수 있습니다. 잘 모르겠습니다.
Yatharth Agarwal 1

@Yatharth 대수는 Shannon 엔트로피의 정의에서 중심적인 역할 때문에 여기서 발생합니다. "이유"는 다른 기능과 달리 정보 측정에 적합한 로그가 Shannon의 "수학적 의사 소통 이론"의 정리 2를 살펴보십시오. 또한 Jayne의 "정보 이론 및 통계 역학"은 좋은 소개입니다.
네이트 교황
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.