동일한 데이터 세트로 다른 이진 분류 알고리즘에서 10 배 교차 검증을 실행했으며 마이크로 및 매크로 평균 결과를 모두 받았습니다. 이것이 다중 레이블 분류 문제라는 점을 언급해야합니다.
필자의 경우, 참 부정과 참 긍정적 가중치는 동일하게 가중됩니다. 즉, 참 긍정을 정확하게 예측하는 것이 참 긍정을 정확하게 예측하는 것과 마찬가지로 중요합니다.
미세 평균 측정 값은 매크로 평균 측정 값보다 낮습니다. 다음은 신경망 및 지원 벡터 시스템의 결과입니다.
또한 다른 알고리즘으로 동일한 데이터 세트에서 백분율 분할 테스트를 실행했습니다. 결과는 다음과 같습니다.
비율 분할 테스트와 매크로 평균 결과를 비교하는 것이 더 좋지만 공정합니까? 나는 진정한 긍정과 긍정의 부정이 동일하게 가중되기 때문에 거시 평균 결과가 바이어스된다고 믿지 않지만 다시 사과와 오렌지를 비교하는 것과 같은지 궁금합니다.
최신 정보
의견을 바탕으로 마이크로 및 매크로 평균을 계산하는 방법을 보여 드리겠습니다.
예측하려는 144 개의 레이블 (기능 또는 속성과 동일)이 있습니다. 각 레이블에 대해 정밀도, 회수 및 F- 측정이 계산됩니다.
---------------------------------------------------
LABEL1 | LABEL2 | LABEL3 | LABEL4 | .. | LABEL144
---------------------------------------------------
? | ? | ? | ? | .. | ?
---------------------------------------------------
진 양성 (tp), 진 음성 (tn), 위양성 (fp) 및 위음성 (fn)을 기반으로 계산 된 이진 평가 측정 값 B (tp, tn, fp, fn)를 고려합니다. 특정 측정의 매크로 및 마이크로 평균은 다음과 같이 계산할 수 있습니다.
이 공식을 사용하여 다음과 같이 마이크로 및 매크로 평균을 계산할 수 있습니다.
따라서 미량 평균 측정 값은 모든 tp, fp 및 fn (각 레이블에 대해)을 추가 한 후 새로운 이진 평가가 수행됩니다. 거시 평균 측정 값은 모든 측정 값 (정밀도, 리콜 또는 F- 측정)을 추가하고 레이블 수로 나눕니다. 이는 평균과 같습니다.
이제 질문은 어느 것을 사용해야합니까?