우선, 나는 "정확성"이 때때로 약간의 오해의 소지가있는 것을 발견합니다.
시스템 또는 방법을 평가하기 위해 일반적으로 정확도 라는 용어 (예 : 분석 화학자)는 예측의 편향을 나타냅니다. 즉, 좋은 예측이 얼마나 평균적인지에 대한 질문에 답합니다.
아시다시피 분류기의 다양한 성능 측면에 대한 다양한 성능 측정 방법이 있습니다. 그중 하나가 정확도라고도합니다. 귀하의 논문이 기계 학습 / 분류 청중을위한 것이 아닌 경우,이 구분을 명확히하는 것이 좋습니다. 이보다 정확한 정확도의 의미조차도 클래스 불균형을 처리하는 여러 가지 방법이 발생할 수 있으므로 정확도라고 부르는 것을 매우 명확하게 알 수 있습니다. 일반적으로 클래스 불균형은 무시되어 잘 알려진 계산으로 이어집니다. 그러나 평균에 가중치를 부여하여 클래스 불균형을 제어하는 정도의 민감도와 특이도를 사용할 수도 있습니다.티피+ T엔a l l c a s e s
F-스코어 들은 정밀도와 재현율의 조화 평균 (또는 양성 예측치 및 감도)로 도입된다. 귀하의 질문에 대해서는 이것을 조금 더 자세히 설명하고 단순화하는 것이 도움이된다고 생각합니다.
에프=2 ⋅ p r e c i s i o n ⋅ r e c a l lp r e c i s i o n + r e c a l l=2티피a l l P 티피리터 (L)의 T티피a l l P +티피리터 (L)의 T=2티피2a l l P ⋅ a l l T티피⋅ a l l T a l l P ⋅ a l l T+티피⋅ a l l P a l l P ⋅ a l l T=2 개 T 피2티피⋅ a l l T + T피⋅a l l P =2 개 T 피리터 (L)의 T + a l l P
마지막 표현은 특정 테스트 사례 그룹으로 생각할 수있는 것의 일부 가 아닙니다 . 특히, TRUE와 POSITIVE 사례 사이에 (중대한) 중복이 예상됩니다. 이것은 F- 점수를 백분율로 표현하는 것을 막을 것입니다. 사실, 나는 독자에게 F- 점수가 그러한 해석을 가지고 있지 않다고 경고한다고 생각합니다.