정밀 리콜 곡선 에서 "최적의"작동 지점을 결정하는 표준 방법이 있습니까? (정밀도와 리콜간에 좋은 절충점을 제공하는 곡선상의 점을 결정)
감사
정밀 리콜 곡선 에서 "최적의"작동 지점을 결정하는 표준 방법이 있습니까? (정밀도와 리콜간에 좋은 절충점을 제공하는 곡선상의 점을 결정)
감사
답변:
"최적"의 정의는 물론 특정 목표에 따라 다르지만 다음은 상대적으로 몇 가지 "표준"방법입니다.
EER (Equal Error Rate) 포인트 : 정밀도가 리콜과 동일한 포인트입니다. 이것은 일부 사람들에게 "자연적인"운영 지점과 같은 느낌을줍니다.
위의 세련되고 더 원칙적인 버전은 다른 종류의 오류 비용을 지정하고 해당 비용을 최적화하는 것입니다. 항목을 잘못 분류하면 (정확도의 오류) 항목이 완전히 누락 된 경우 (리콜 오류)보다 두 배나 비쌉니다. 그런 다음 가장 좋은 작동 지점은 (1-불러 오기) = 2 * (1-정밀도)입니다.
어떤 문제에서 사람들은 자연스럽고 허용 가능한 정밀도 또는 회수율을 가지고 있습니다. 검색된 데이터의 20 % 이상이 올바르지 않으면 사용자가 애플리케이션 사용을 중지한다는 것을 알고 있습니다. 그런 다음 정밀도를 80 % (또는 조금 더 낮게)로 설정하고 그 시점에서 가지고있는 모든 리콜을 수락하는 것이 당연합니다.