원본 게시물-http: //rushdishams.blogspot.in/2011/08/micro-and-macro-average-of-precision.html
마이크로 평균법에서는 여러 세트에 대해 시스템의 개별 참 긍정, 거짓 긍정 및 거짓 부정을 요약하고 적용하여 통계를 얻습니다.
까다로운, 그러나 나는 이것이 매우 흥미로운 것을 알았습니다. 이러한 평균 정보 검색 및 분류 통계를 얻을 수있는 두 가지 방법이 있습니다.
1. 마이크로 평균법
마이크로 평균법에서는 여러 세트에 대해 시스템의 개별 참 긍정, 거짓 긍정 및 거짓 부정을 요약하고 적용하여 통계를 얻습니다. 예를 들어 데이터 집합의 경우 시스템의
True positive (TP1) = 12
False positive (FP1) = 9
False negative (FN1) = 3
그러면 정밀도 (P1) 및 리콜 (R1)은 및57.14%=TP1TP1+FP180%=TP1TP1+FN1
다른 데이터 세트의 경우 시스템의
True positive (TP2) = 50
False positive (FP2) = 23
False negative (FN2) = 9
그러면 정밀도 (P2)와 리콜 (R2)은 68.49와 84.75가됩니다.
이제 마이크로 평균법을 사용한 시스템의 평균 정밀도와 회수율은
Micro-average of precision=TP1+TP2TP1+TP2+FP1+FP2=12+5012+50+9+23=65.96
Micro-average of recall=TP1+TP2TP1+TP2+FN1+FN2=12+5012+50+3+9=83.78
Micro-average F-Score는이 두 수치의 조화 평균입니다.
2. 매크로 평균법
이 방법은 간단합니다. 다른 세트에서 시스템의 정밀도와 리콜의 평균을 취하십시오. 예를 들어, 주어진 예제에 대한 거시 평균 정밀도와 시스템의 리콜은
매크로 평균 리콜=R1+R2Macro-average precision=P1+P22=57.14+68.492=62.82
Macro-average recall=R1+R22=80+84.752=82.25
거시 평균 F- 점수는이 두 수치의 조화 평균 일뿐입니다.
적합성 매크로 평균 방법은 시스템이 전체 데이터 세트에서 어떻게 수행되는지 알고 싶을 때 사용할 수 있습니다. 이 평균에 대한 구체적인 결정을 내리지 않아야합니다.
반면, 마이크로 평균은 데이터 집합의 크기가 다양 할 때 유용한 측정 방법이 될 수 있습니다.