거리 상관과 상호 정보


15

나는 한동안 상호 정보를 다루었습니다. 그러나 "상관 상관 관계"에서 분포 독립성을 측정하는 데 사용할 수있는 매우 최근의 측정법 (소위 상관 관계라고도 함) (브라우니 안 상관 관계라고도 함)을 찾았습니다. http://en.wikipedia.org/wiki/Brownian_covariance . 이 법안이 소개 된 논문을 확인했지만 상호 정보를 암시하지는 않았습니다.

그래서 내 질문은 :

  • 그들은 정확히 같은 문제를 해결합니까? 그렇지 않다면 어떻게 문제가 다른가?
  • 그리고 이전 질문에 긍정적으로 대답 할 수 있다면, 하나를 사용하는 것의 장점은 무엇입니까?

간단한 예를 위해 '거리 상관'과 '상호 정보'를 명시 적으로 적어보십시오. 두 번째 경우에는 로그를 얻을 수 있지만 첫 번째는 그렇지 않습니다.
Piotr Migdal

@PiotrMigdal 예, 그 차이를 알고 있습니다. 왜 중요한지 설명해 주시겠습니까? 제가 통계학자가 아님을 고려하십시오.
dsign

확률 분포의 상호 의존성을 측정하는 표준 도구는 상호 정보입니다. 그것은 좋은 속성을 많이 가지고 있으며 그 해석은 간단합니다. 그러나 거리 상관이 선호되는 특정 문제가있을 수 있지만 (내 인생에서는 결코 사용하지 않았습니다) 그래서 당신이 해결하려는 문제는 무엇입니까?
Piotr Migdal

2
이 의견은 몇 년 늦었지만 Columbia University의 통계 부서는 2013-2014 학년도를 의존도 측정에 중점을 두었습니다. 2014 년 4 월 ~ 5 월에는 Reshef Brothers (MIC), Gabor Szekely (거리 상관 관계), Subhadeep Mukhopadhay 등이 분야에서 일하는 최고 학자들을 모으는 워크숍이 열렸습니다. 프리젠 테이션의 많은 pdf가 포함 된 프로그램에 대한 링크입니다. dependence2013.wikischolars.columbia.edu/…
Mike Hunter

답변:


9

정보 / 상호 정보는 가능한 값에 의존하지 않으며 확률에만 의존하므로 덜 민감합니다. 거리 상관 관계 분석이 더 강력하고 간단 해졌습니다. 비교를 위해

http://www-stat.stanford.edu/~tibs/reshef/comment.pdf


2
안녕, 답변 주셔서 감사합니다! 당신이 참조하는 논문은 MIC에 관한 것입니다. 저는 MI보다 조금 더 믿습니다. 나는 거리 상관 측정을 구현했으며 불연속 범주 변수의 원소 경우 MI보다 간단하지 않다고 생각합니다. 다시 한 번 배운 것은 DCM이 잘 정의되고 연속 변수에 대해 잘 작동한다는 것입니다. 그러나 MI를 사용하면 비닝 (binning) 또는 멋진 일을 MIC로해야합니다.
dsign

3
그러나 DCM은 측면이 샘플 수인 정사각 행렬이 필요한 것 같습니다. 즉, 공간 복잡도는 2 차적으로 확장됩니다. 또는 적어도 그것은 나의 인상입니다, 나는 실수하고 싶습니다. MIC는 정밀도와 성능 사이의 타협으로 조정할 수 있기 때문에 더 좋습니다.
dsign
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.