정밀 리콜 곡선에서 좋은 작동 점을 선택하는 방법은 무엇입니까?


답변:


12

"최적"의 정의는 물론 특정 목표에 따라 다르지만 다음은 상대적으로 몇 가지 "표준"방법입니다.

  • EER (Equal Error Rate) 포인트 : 정밀도가 리콜과 동일한 포인트입니다. 이것은 일부 사람들에게 "자연적인"운영 지점과 같은 느낌을줍니다.

  • 위의 세련되고 더 원칙적인 버전은 다른 종류의 오류 비용을 지정하고 해당 비용을 최적화하는 것입니다. 항목을 잘못 분류하면 (정확도의 오류) 항목이 완전히 누락 된 경우 (리콜 오류)보다 두 배나 비쌉니다. 그런 다음 가장 좋은 작동 지점은 (1-불러 오기) = 2 * (1-정밀도)입니다.

  • 어떤 문제에서 사람들은 자연스럽고 허용 가능한 정밀도 또는 회수율을 가지고 있습니다. 검색된 데이터의 20 % 이상이 올바르지 않으면 사용자가 애플리케이션 사용을 중지한다는 것을 알고 있습니다. 그런 다음 정밀도를 80 % (또는 조금 더 낮게)로 설정하고 그 시점에서 가지고있는 모든 리콜을 수락하는 것이 당연합니다.


2

SheldonCooper의 두 번째 및 세 번째 글 머리 기호에 대한 후속 조치 : 이상적인 선택은 다른 사람 이 임계 값 (포인트 3) 또는 비용 편익 거래 (포인트 2)의 형태로 선택하도록하는 입니다. 그리고 그들에게 선택을 제공하는 가장 좋은 방법은 ROC 곡선 입니다.


1

이것이 얼마나 "표준"인지는 확실하지 않지만, 한 가지 방법은 (1, 1)에 가장 가까운 지점, 즉 100 % 리콜 및 100 % 정밀도를 선택하는 것입니다. 이것이 두 측정 값 사이의 최적 균형입니다. 이것은 당신이 리콜보다 정밀도를 중요시하지 않는다고 가정하고 그 반대의 경우도 마찬가지입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.