mAP 메트릭은 무엇이며 어떻게 계산됩니까?


답변:


47

인용은 위에서 언급 한 Zisserman 논문 에서 인용 한 것입니다 -4.2 결과 평가 (페이지 11) :

먼저 "중복 기준"은 0.5보다 큰 교차 결합으로 정의됩니다. (예를 들어, 예측 된 상자가 실측 값 상자와 관련하여이 기준을 충족하면 탐지로 간주됩니다). 그런 다음이 "탐욕스러운"접근 방식을 사용하여 GT 상자와 예측 된 상자간에 일치가 이루어집니다.

방법에 의해 출력 된 탐지는 (감소하는) 신뢰도 출력에 의해 순위가 매겨진 순서대로 중첩 기준을 충족하는 Ground Truth 객체에 할당되었습니다. 이미지에서 동일한 물체에 대한 다중 탐지는 잘못된 탐지로 간주되었습니다. 예를 들어 단일 물체에 대한 5 개의 탐지는 1 개의 올바른 탐지와 4 개의 잘못된 탐지로 계산됩니다.

따라서 각 예측 상자는 참 양성 또는 거짓 양성입니다. 각 실측 상자는 True-Positive입니다. 참 음성이 없습니다.

그런 다음 평균 정밀도는 재현율이 [0, 0.1, ..., 1] 범위에있는 정밀도-재현율 곡선의 정밀도 값을 평균화하여 계산됩니다 (예 : 11 개의 정밀도 값의 평균). 더 정확하게 말하자면, 약간 수정 된 PR 곡선을 고려합니다. 여기서 각 곡선 점 (p, r)에 대해 p '> p 및 r'> = r과 같은 다른 곡선 점 (p ', r')이있는 경우 , p를 해당 포인트의 최대 p '로 대체합니다.

나에게 여전히 불분명 한 것은 (신뢰도가 0이더라도) 감지 되지 않는 GT 상자로 수행되는 작업입니다 . 이것은 정밀도-재현율 곡선이 결코 도달하지 않는 특정 재 호출 값이 있음을 의미하며, 이는 평균 정밀도 계산이 정의되지 않음을 의미합니다.

편집하다:

짧은 대답 : 리콜에 도달 할 수없는 지역에서는 정밀도가 0으로 떨어집니다.

이를 설명하는 한 가지 방법은 신뢰도 임계 값이 0에 가까워 지면 이미지 전체 에서 무한한 수의 예측 경계 상자가 켜진다 고 가정하는 것 입니다. 그런 다음 정밀도는 즉시 0이되고 (GT 상자의 수가 한정되어 있기 때문에) 리콜은 100 %에 도달 할 때까지이 평평한 곡선에서 계속 증가합니다.


3
그것이 불분명 한 유일한 것은 아닙니다. 두 개의 예측 박스 (P1, P2)와 두 개의 실측 박스 (T1, T2)가있는 경우를 생각해보십시오. 여기서 P2는 P1보다 신뢰도가 높습니다. P1과 P2는 모두 T1과 겹칩니다. P2는 신뢰도가 높기 때문에 P2가 T1과 일치하는 것으로 간주되어야한다는 것이 분명합니다. 제공되지 않는 것은 P1이 T2와 일부 IOU가 겹치지 만 T1이있는 IOU보다 낮다면, P1이 T2에 자신을 일치 시키려고 "두 번째 기회"를 주어야합니까, 아니면 그렇지 않습니까?
Martin

누군가가 감지되지 않은 GT 상자의 문제를 명확히 할 수 있습니까?
Jonathan

@Jonathan : 그래서 우리는 단순히 IoU <0.5 인 예측을 버리고 IoU> = 0.5 인 예측에 대한 PR 곡선 아래 면적을 계산합니까?
Alex

@Alex 아니요. IoU <0.5 인 예측은 거짓 양성입니다.
Jonathan

1
당신은에서 볼 수 @Martin github에 , P1은 두 번째 기회 만 가양이 없습니다.
qq456cvb

50

mAP는 평균 평균 정밀도입니다.

정보 검색 (참조 [1] [2] ) 및 다중 클래스 분류 (객체 감지) 설정 분야에서 사용 방법이 다릅니다 .

객체 감지를 위해 계산하려면 모델 예측을 기반으로 데이터의 각 클래스에 대한 평균 정밀도를 계산합니다. 평균 정밀도는 클래스의 정밀도-재현율 곡선 아래 영역과 관련이 있습니다. 그런 다음 이러한 평균 개별 클래스 정밀도의 평균을 취하면 평균 평균 정밀도가 제공됩니다.

평균 정밀도를 계산하려면 [3]을 참조하십시오 .


32

탐지를 위해 하나의 객체 제안이 옳았는지 확인하는 일반적인 방법은 Intersection over Union (IoU, IU)입니다. A 제안 된 객체 픽셀 세트와 실제 객체 픽셀 세트 를 가져 와서 다음을 B계산합니다.

일반적으로 IoU> 0.5는 히트 였음을 의미하고 그렇지 않으면 실패했습니다. 각 클래스에 대해 다음을 계산할 수 있습니다.

  • 참 양성 TP (c) : 클래스 c에 대한 제안이 있었고 실제로 클래스 c의 객체가있었습니다.
  • False Positive FP (c) : 클래스 c에 대한 제안이 있었지만 클래스 c의 대상이 없습니다.
  • 클래스 c의 평균 정밀도 :

mAP (평균 평균 정밀도)는 다음과 같습니다.

참고 : 더 나은 제안을 원하면 IoU를 0.5에서 더 높은 값 (완벽한 최대 1.0까지)으로 늘립니다. mAP @ p로이를 나타낼 수 있습니다. 여기서 p \ in (0, 1)은 IoU입니다.

mAP@[.5:.95] mAP가 여러 임계 값에 대해 계산 된 다음 다시 평균화됨을 의미합니다.

편집 : 자세한 정보는 COCO 평가 지표를 참조하십시오.


9

여기서 중요한 부분은 물체 감지 가 평균 정밀도에 대한 우수한 설명이 하나 이상 존재하는 표준 정보 검색 문제와 동일한 것으로 간주 될 수있는 방법을 연결하는 것이라고 생각합니다 .

일부 객체 감지 알고리즘의 출력은 제안 된 경계 상자 집합이며 각 상자에 대한 신뢰도 및 분류 점수 (클래스 당 하나의 점수)입니다. 지금은 분류 점수를 무시하고 신뢰도를 임계 값 이진 분류 에 대한 입력으로 사용하겠습니다 . 직관적으로 평균 정밀도는 임계 값 / 차단 값에 대한 모든 선택 항목에 대한 집계입니다. 하지만 기다려; 정밀도를 계산하려면 상자가 올바른지 알아야합니다!

이것이 혼란 스럽거나 어려운 곳입니다. 일반적인 정보 검색 문제와 달리 실제로 여기에는 추가 수준의 분류가 있습니다. 즉, 상자간에 정확한 일치를 수행 할 수 없으므로 경계 상자가 올바른지 여부를 분류해야합니다. 해결책은 기본적으로 상자 치수에 대해 하드 코딩 된 분류를 수행하는 것입니다. 우리는 그것이 '올바른'것으로 간주 될만한 근거와 충분히 겹치는 지 확인합니다. 이 부분의 임계 값은 상식에 따라 선택됩니다. 작업중인 데이터 세트는 '올바른'경계 상자에 대한이 임계 값이 무엇인지 정의 할 것입니다. 대부분의 데이터 세트는 0.5 IoU로 설정 하고 그대로 둡니다 (실제로 IoU가 얼마나 엄격한 지 확인하려면 몇 가지 수동 IoU 계산을 수행하는 것이 좋습니다.).

이제 '정확하다'는 의미를 실제로 정의 했으므로 정보 검색과 동일한 프로세스를 사용할 수 있습니다.

평균 평균 정밀도 (mAP)를 찾으려면 해당 상자와 관련된 분류 점수의 최대 값을 기준으로 제안 된 상자를 계층화 한 다음 클래스에 대한 평균 정밀도 (AP)의 평균을냅니다 (평균을 취합니다).

TLDR; 경계 상자 예측이 '올바른'(추가 분류 수준)인지 결정하고 상자 신뢰도가 '올바른'경계 상자 예측 (정보 검색 사례와 완전히 유사 함)에 대해 얼마나 잘 알려주는지 평가하고 다음의 일반적인 설명을 구분합니다. mAP이 의미가 있습니다.


정밀도 / 재현율 곡선 아래의 면적은 평균 정밀도와 동일 하며 본질적으로 적분을 근사하기위한 사다리꼴 또는 오른손 법칙을 사용하여이 면적을 근사화 한다는 점에 주목할 가치가 있습니다.


3

정의 : mAP → 평균 정밀도

대부분의 물체 감지 대회에서 감지 할 범주가 많으며 모델 평가는 매번 특정 범주에 대해 수행되며 평가 결과는 해당 범주의 AP입니다.

모든 범주를 평가할 때 모든 AP의 평균은 모델의 최종 결과 인 mAP로 계산됩니다.


0

여기에 이미지 설명 입력

IOU (Intersection Over Union)는 두 경계 상자 간의 겹침을 평가하는 Jaccard Index를 기반으로하는 측정입니다. IOU를 적용하면 감지가 유효한지 (True Positive) 아닌지 (False Positive)를 알 수 있습니다. 진실 경계 상자는 그들 사이의 결합 영역으로 나뉩니다.


문제는 IoU가 아니라 mAP에 관한 것입니다. 따라서 최소한 IoU가 mAP와 어떻게 관련되어 있는지 명확히해야합니다.
nbro
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.