나는 비 통계 학자들이 회귀 (또는 동등하거나 밀접한 관련 통계 테스트)보다는 상호 정보를 사용하여 상관 측정을 재창조하는 것처럼 보이는 몇 가지 대화를 보았습니다.
통계 학자들이이 접근법을 사용하지 않는 좋은 이유가 있다고 생각합니다. 저의 평신도의 이해는 엔트로피 / 상호 정보 추정자가 문제가 있고 불안정한 경향이 있다는 것입니다. 결과적으로 전력도 문제가 있다고 가정합니다. 그들은 파라 메트릭 테스팅 프레임 워크를 사용하지 않는다고 주장함으로써이 문제를 해결하려고합니다. 일반적으로 이런 종류의 작업은 전력 계산이나 신뢰 / 신뢰할 수있는 간격을 방해하지 않습니다.
그러나 악마의 옹호자 입장을 취하기 위해 데이터 세트가 매우 클 때 느린 수렴은 큰 문제입니까? 또한, 이러한 방법은 후속 연구에 의해 협회가 검증된다는 의미에서 "작동"하는 것처럼 보입니다. 상호 정보를 연관 척도로 사용하는 것에 대한 가장 좋은 비판은 무엇이며 통계 관행에 널리 사용되지 않는 이유는 무엇입니까?
편집 : 또한 이러한 문제를 다루는 좋은 논문이 있습니까?