이 강의 노트 (5 페이지)에 설명 된대로 상호 정보 개념을 기능 선택에 적용하려고합니다 .
내 플랫폼은 Matlab입니다. 경험적 데이터에서 상호 정보를 계산할 때 발견되는 한 가지 문제는 숫자가 항상 위쪽으로 편향되어 있다는 것입니다. Matlab Central에서 MI를 계산하기 위해 약 3 ~ 4 개의 다른 파일을 찾았으며 독립적 인 무작위 변수를 입력하면 모두 0.4와 같은 큰 숫자를 나타냅니다.
나는 전문가가 아니지만 문제는 단순히 MI를 계산하기 위해 조인트 및 한계 밀도를 사용하는 경우 MI가 정의에 의해 바이어스이기 때문에 바이어스가 프로세스에 도입된다는 것입니다. 상호 정보를 정확하게 평가하는 방법에 대한 실질적인 조언이 있습니까?
실제로 관련된 질문은 실제로 사람들이 실제로 MI를 사용하여 기능을 선택하는 방법입니다. MI가 이론적으로 무한하기 때문에 임계 값을 얻는 방법은 분명하지 않습니다. 아니면 사람들이 MI에 의해 기능의 순위를 매기고 최고의 k 기능을 사용합니까?