3
불균형이 심한 환경에서 비용에 민감한 학습을위한 제안
몇 백만 행과 ~ 100 열의 데이터 집합이 있습니다. 공통 클래스에 속하는 데이터 세트의 예제 중 약 1 %를 감지하고 싶습니다. 최소 정밀도 제약이 있지만 매우 비대칭 적 인 비용으로 인해 특정 리콜에 너무 열중하지 않습니다 (10 개의 긍정적 인 일치가 남지 않는 한)! 이 설정에서 권장 할 몇 가지 …
P & R은 검색된 인스턴스 세트의 관련성을 측정하는 방법입니다. 정밀도는 검색된 모든 인스턴스 중에서 올바른 인스턴스의 %입니다. 관련성은 검색된 실제 인스턴스의 비율입니다. P & R의 조화 평균은 F1 점수입니다. P & R은 데이터 마이닝에서 분류자를 평가하는 데 사용됩니다.