f- 측정은 정확성과 동의어입니까?


11

나는 f- 측정 (정밀도와 리콜에 기초한)이 분류 기가 얼마나 정확한지 추정한다는 것을 이해합니다. 또한 불균형 데이터 세트가있을 때 정확도보다 f- 측정이 선호 됩니다. 간단한 질문이 있습니다 (기술보다는 올바른 용어를 사용하는 것에 관한 것입니다). 불균형 데이터 세트가 있으며 실험에서 f- 측정을 사용합니다. 머신 러닝 / 데이터 마이닝 회의 가 아닌 논문을 쓰려고합니다 . 따라서이 문맥에서 f- 측정을 정확하게 동의어로 지칭 할 수 있습니까? 예를 들어, f- 측정 값이 0.82인데 분류 기가 82 % 정확한 예측을 달성한다고 말할 수 있습니까?


f- 측정을 사용하면 소개하는 것이 좋습니다. 내 입장에서 두 가지를 대체하는 것은 올바르지 않습니다. 귀하의 경우 정확도가 99 % 인 경우 f- 측정 값에 관계없이 99 % 정확한 예측을 달성 할 수 있으며 이는 독자에게 오류를 유발할 수 있습니다.
AdrienNK

@AdrienNK : 테스트 사례의 상대 주파수가 실제 애플리케이션 상황과 동일하지 않은 경우 99 % 정확도는 99 % 정확한 예측을 의미하지 않습니다.
SX에 불만 cbeleites

@cbeleites 당신 말이 맞습니다. 그러나 종종 테스트 케이스는 동일한 분포에서 발행됩니다 (아마도 필자가 그렇지 않은 데이터로 거의 작업하지 않았기 때문에 바이어스 된보기 일 것입니다)
AdrienNK

@AdrienNK : 저는 의료 진단을 위해 일하는 분석 화학자입니다. 문제의 질병의 유병률은 환자의 소집단 간 정도에 따라 다를 수 있습니다. 예를
들어이

2
정말 흥미로 웠습니다. 제 관심을 가져 주셔서 감사합니다.
AdrienNK

답변:


13

우선, 나는 "정확성"이 때때로 약간의 오해의 소지가있는 것을 발견합니다.

시스템 또는 방법을 평가하기 위해 일반적으로 정확도 라는 용어 (예 : 분석 화학자)는 예측의 편향을 나타냅니다. 즉, 좋은 예측이 얼마나 평균적인지에 대한 질문에 답합니다.

아시다시피 분류기의 다양한 성능 측면에 대한 다양한 성능 측정 방법이 있습니다. 그중 하나가 정확도라고도합니다. 귀하의 논문이 기계 학습 / 분류 청중을위한 것이 아닌 경우,이 구분을 명확히하는 것이 좋습니다. 이보다 정확한 정확도의 의미조차도 클래스 불균형을 처리하는 여러 가지 방법이 발생할 수 있으므로 정확도라고 부르는 것을 매우 명확하게 알 수 있습니다. 일반적으로 클래스 불균형은 무시되어 잘 알려진 계산으로 이어집니다. 그러나 평균에 가중치를 부여하여 클래스 불균형을 제어하는 ​​정도의 민감도와 특이도를 사용할 수도 있습니다.+ 에스이자형에스

F-스코어 들은 정밀도와 재현율의 조화 평균 (또는 양성 예측치 및 감도)로 도입된다. 귀하의 질문에 대해서는 이것을 조금 더 자세히 설명하고 단순화하는 것이 도움이된다고 생각합니다.

에프=2아르 자형이자형나는에스나는영형아르 자형이자형아르 자형이자형나는에스나는영형+아르 자형이자형=2  +=22   +  =2 2 + =2  + 

마지막 표현은 특정 테스트 사례 그룹으로 생각할 수있는 것의 일부 가 아닙니다 . 특히, TRUE와 POSITIVE 사례 사이에 (중대한) 중복이 예상됩니다. 이것은 F- 점수를 백분율로 표현하는 것을 막을 것입니다. 사실, 나는 독자에게 F- 점수가 그러한 해석을 가지고 있지 않다고 경고한다고 생각합니다.


보다 구체적으로 이것은 측정입니다. F- 점수는 별도의 매개 변수로 일반화 할 수 있습니다에프1
qwr

0

빠른 답변 :

아니요, F-measure수식은 TN요인 으로 구성되지 않으며 검색 문제 (doc) 에 유용합니다 .

따라서, (의 F-measure올바른 접근 방식이 불균형 데이터 집합을 평가하거나 검색 문제의 경우 대신하여) accuracyROC.

Accuracy = (TP+TN) / (TP+FP+FN+TN)

F1_Score = 2*(Recall * Precision) / (Recall + Precision)
# or
F1_Score = 2*TP / (2*TP + FP + FN)

[ 참고 ] :

Precision = TP / (TP+FP)

Recall = TP / (TP+FN)
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.