이해를 돕기 위해 몇 가지 다른 방법으로 설명하겠습니다.
구체적인 예를 들어 봅시다. 당신은 사람들의 그룹에서 질병에 대한 테스트를하고 있습니다. 이제 몇 가지 용어를 정의 해 봅시다. 다음 각 항목에 대해 테스트를받은 개인을 말합니다.
진 양성 (TP) : 질병이있는 것으로 확인 됨
False positive (FP) : 질병이없는 것으로 질병이있는 것으로 확인 됨
완전 음성 (TN) : 질병이없는 것으로 확인 된 질병이없는 것
거짓 음성 (FN) : 질병이없는 것으로 확인 됨
시각적으로 이것은 일반적으로 혼동 행렬을 사용하여 표시됩니다 .
위양성률 (FPR)이 질병을 가지고 있지 않지만 질병 (모든 FPS)이있는 것으로 확인 된 사람들의 수입니다 질병이없는 사람들의 총 개수로 나눈를 (포함 모든 FPS와 TN은) .
에프피R = F피에프피+ T엔
거짓 발견 율 (FDR)는 질병을 가지고 있지 않지만 질병 (모든 FPS)를 가진 것으로 확인 된 사람들의 수이며, 질병을 가진 것으로 확인 된 사람들의 총 개수로 나눈 (모든 FPS 역방향 채널을 포함 ).
에프D R = F피에프피+ T피
차이점은 분모에 있습니다. 즉 오 탐지 수를 비교하는 것은 무엇입니까?
FPR은 당신에게 질병을 가진 것으로 확인 될 질병이없는 모든 사람의 비율을 말하고있다.
FDR은 당신에게 질병이없는 질병을 가진 것으로 확인 된 모든 사람의 비율을 말하고있다.
따라서 둘 다 유용하고 뚜렷한 실패 척도입니다. 상황과 TP, FP, TN 및 FN의 비율에 따라 서로에 대해 더 관심이있을 수 있습니다.
이제 이것에 몇 개의 숫자를 넣겠습니다. 질병에 대해 100 명을 측정했으며 다음과 같은 결과가 나타납니다.
진 양성 (TP) : 12
오 탐지 (FP) : 4
진정한 부정 (TN) : 76
거짓 부정 (FN) : 8
혼동 행렬을 사용하여이를 표시하려면 다음을 수행하십시오.
그때,
에프피R = F피에프피+ T엔= 44 + 76= 480= 0.05 = 5 %
에프D R = F피에프피+ T피= 44 + 12= 416= 0.25 = 25 %
다른 말로,
FPR은 질병을 앓지 않은 사람의 5 %가 질병을 앓고있는 것으로 확인되었다고 말합니다. FDR은 질병을 앓고있는 것으로 확인 된 사람들의 25 %가 실제로 질병을 가지고 있지 않다고 말합니다.
@amoeba의 의견 (위 예제의 숫자)을 기준으로 편집하십시오.
엔
[Side note : Wikipedia에 따르면 FPR은 수학적으로 제 1 종 오류율과 동일하지만 하나는 일반적으로 우선 순위 가 설정 되고 다른 하나는 일반적으로 테스트의 성능을 측정하는 데 사용 되므로 개념적으로 구별되는 것으로 간주됩니다 . 이것은 중요하지만 여기서는 논의하지 않겠습니다.]
그리고 좀 더 완전성을 위해 :
분명히 FPR과 FDR은 혼동 행렬에서 4 가지 수량으로 계산할 수있는 유일한 관련 메트릭이 아닙니다. 서로 다른 상황에서 유용 할 수 있는 여러 가지 가능한 메트릭 중에서 상대적으로 자주 발생하는 두 가지 메트릭 은 다음과 같습니다.
민감성 이라고도 알려진 TPR (True Positive Rate) 은 질병에 걸린 것으로 확인 된 사람의 비율입니다.
티피R = T피티피+ F엔
특이성으로 도 알려진 True Negative Rate (TNR) 는 질병이없는 것으로 확인 된 질병이없는 사람의 비율입니다.
티엔R = T엔티엔+ F피