Hellinger Distance 란 무엇이며 언제 사용합니까?


19

Hellinger Distance에서 실제로 어떤 일이 일어나는지 알고 싶습니다 (간단한 용어로). 또한 Hellinger Distance를 사용할 수있는 유형의 문제를 알고 싶습니다. Hellinger Distance를 사용하면 어떤 이점이 있습니까?


9
Hellinger 거리는 유클리드 거리의 확률 적 아날로그입니다. 두드러진 속성은 메트릭으로서의 대칭입니다. 이러한 수학적 특성은 종이를 쓸 때 증거를 가능하게하는 특정 특성을 가진 거리 함수가 필요한 경우에 유용합니다. 응용 프로그램에서 누군가는 특정 작업에 대해 한 메트릭이 다른 메트릭보다 더 좋거나 더 나은 결과를 생성한다는 것을 알 수 있습니다. 예를 들어, Wasserstein 거리는 생식 적대 네트워크의
Emre

의견 감사합니다. 나는이 질문을 보았습니다.이 질문은 지금 가지고있는 질문과 매우 유사합니다. datascience.stackexchange.com/questions/22324/… 답변에 Hellinger Distance가 적합한 이유가 무엇인지 알려주십시오.
Smith Volka

2
측정 항목 공간에서 주제 를 시각화 할 수 있습니다. 또 다른 좋은 속성은 Hellinger 거리가 다른 지원을 가진 분포에 대해 유한하다는 것입니다. 이러한 질문을하는 것이 좋습니다. 본인에 대해 다른 측정 항목을 시도하고 결과를 관찰하는 것이 좋습니다.
Emre

감사. 좋은 연결입니다. 많은 도움이됩니다. 그러나 Hellinger 거리는 링크에서 언급 한 Latent Dirichlet Allocation (LDA)에서 파생 된 주제로만 제한됩니까?
스미스 볼카

1
아니요, LDA와 본질적으로 관련이 없습니다.
Emre

답변:


7

헬 링거 거리는 두 확률 분포 사이의 차이를 측정하는 지표입니다. 유클리드 거리 의 확률 적 유사체입니다 .

두 확률 분포 와 주어지면 Hellinger 거리는 다음과 같이 정의됩니다.PQ

h(P,Q)=12PQ2

두 확률 분포 간의 차이를 정량화 할 때 유용합니다. 예를 들어, 서비스 사용자 및 비 사용자에 대한 분포를 추정하는 경우. 일부 지형지 물에 대해 그룹 간 Hellinger 거리가 작은 경우 해당 지형지 물은 통계적으로 분할에 유용하지 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.