콘텐츠 기반 이미지 검색 시스템을 만드는 데이터 마이닝 할당이 있습니다. 5 마리의 동물 이미지가 20 개 있습니다. 총 100 개의 이미지가 있습니다.
내 시스템은 가장 관련성이 높은 10 개의 이미지를 입력 이미지로 반환합니다. 이제 Precision-Recall 곡선으로 시스템 성능을 평가해야합니다. 그러나 Precision-Recall 곡선의 개념을 이해하지 못합니다. 내 시스템이 고릴라 이미지에 대해 10 개의 이미지를 반환하지만 그 중 4 개만 고릴라라고 가정합니다. 반환 된 다른 6 개의 이미지는 다른 동물입니다. 그러므로,
- 정밀도는
4/10 = 0.4
(관련 반환) / (모든 반환) - 리콜은
4/20 = 0.2
(관련 제품 반환) / (모든 관련 사항)
따라서 <0.2,0.4>
곡선이 아닌 점만 있습니다. 커브 (예 : 점 집합)는 어떻게합니까? 반환 된 이미지 수를 변경해야합니까 (필자의 경우 10으로 고정됨)?