참 긍정, 거짓 부정 율이 주어지면 거짓 긍정, 참 부정을 계산할 수 있습니까?


24

다음 True Positive (TP)False Negative (FN)같은 값이 있습니다.

TP = 0.25
FN = 0.75

이 값에서, 우리는 계산할 수 False Positive (FP)True Negative (TN)?

답변:


53

이 분야에는 약간의 용어 혼란이 있습니다. 개인적으로, 나는 항상 이것에 대해 생각하기 위해 혼란 매트릭스로 돌아 오는 것이 유용하다는 것을 알고 있습니다. 분류 / 선별 테스트에서는 다음과 같은 네 가지 상황을 가질 수 있습니다.

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

이 표에서 "참 긍정", "거짓 긍정", "거짓 긍정"및 "참 부정"은 이벤트 (또는 확률)입니다. 당신이 가진 것은 따라서 아마 진정한 긍정적 인 비율 과 잘못된 부정적인 비율 입니다. 두 숫자에 분자와 분모가 있음을 강조하기 때문에 구별이 중요합니다.

약간 혼동되는 부분은 분모가 다른 "false positive rate"및 "false negative rate"에 대한 몇 가지 정의를 찾을 수 있다는 것입니다.

예를 들어, Wikipedia 는 다음과 같은 정의를 제공합니다.

  • 아르 자형=/(+에프)
  • 에프아르 자형=에프/(에프+)
  • 아르 자형=/(에프+)

모든 경우에 분모는 합계입니다. 이것은 또한 그들의 해석에 대한 신호를 제공합니다. 진정한 양의 비율은 실제 값이 실제로 A 일 때 (즉, A가 참인 조건부 확률입니다) 테스트에서“A”라고 말할 확률입니다. 이것은 “A”를 부를 때 얼마나 정확해야하는지 알려주지 않습니다 (즉, 테스트 결과에 따라 참 긍정의 확률은“A”임).

위음성 비율이 동일한 방식으로 정의되었다고 가정하면 (숫자가이 값과 일치 함). 그러나 우리는 특이성에 대한 정보를 제공하지 않기 때문에, 즉“A가 아님”이 정답 일 때 시험이 어떻게 행동하는지에 따라, 양성 양성 또는 거짓 음성 비율에서 오 탐률을 직접 도출 할 수 없습니다. 따라서 혼동 행렬의 오른쪽 열에 대한 정보가 없으므로 질문에 대한 대답은 "아니오, 불가능합니다"입니다.에프아르 자형=1아르 자형

그러나 문헌에는 다른 정의가 있습니다. 예를 들어, Fleiss ( 요금 및 비율에 대한 통계 방법 )는 다음을 제공합니다.

  • "[…] 가양 성 비율 […]은 실제로 질병이없는 양성 반응자 중 사람들의 비율입니다."
  • "거짓 부정적인 비율 […]은 검사에 부정적인 반응을 보인 사람들 중 질병에 걸린 사람들의 비율입니다."

(그는 또한 이전의 정의를 인정하지만 민감도와 특이성과 직접적인 관계가 있기 때문에“귀중한 용어가 낭비”된 것으로 간주합니다.)

혼동 행렬을 참조하면 및 이므로 분모가 총계입니다. 중요하게도, 이러한 정의 하에서 위양성 및 위음성 비율은 테스트의 민감도와 특이성에서 직접 도출 될 수 없습니다. 또한 유병률 (즉, 관심 모집단에서 A가 얼마나 자주 발생하는지)도 알아야합니다.에프아르 자형=에프/(+에프)에프아르 자형=에프/(+에프)

Fleiss는 문구 "참 음성 비율"또는 "참 양성 비율"을 사용하거나 정의하지 않지만 특정 시험 결과 / 분류에 따라 조건부 확률이라고 가정 할 경우 @ guill11aume이 정답입니다.

어쨌든, 당신의 질문에 대한 확실한 대답이 없기 때문에 정의에주의해야합니다.


4
아주 좋습니다 (+1). 나는 즉시 하나의 해석으로 뛰어 들었지만 대체 정의가 표준이라는 것은 옳습니다.
gui11aume

1
@ gui11aume. 감사! 그것은 내 느낌이지만 그것에 대해 생각하고, 나는 더 이상 확신하지 못합니다. 참고 문헌을 보면 현장에 따라 다를 수 있습니다 (기계 학습 대 의료 테스트).
갈라

내 경험은 후자의 정의 인 TPR = TP / (TP + FP), FPR = FP / (TP + FP)가 더 표준 적이라는 것입니다.
travelingbones

1
다음은 차이의 게시는 다음과 같습니다 link.springer.com/article/10.1007/s10899-006-9025-5#enumeration의 새로운 용어 "테스트 FPR은"대 "는 예측 FPR은"주
travelingbones

8

편집 : Gaël Laurans의 답변을 참조하십시오.

실제 양수 비율이 0.25 인 경우 양수를 호출 할 때마다 0.75의 확률이 잘못 될 수 있습니다. 이것은 당신의 오 탐율입니다. 마찬가지로, 네거티브를 부를 때마다 0.25의 확률이 맞습니다. 이것이 바로 네거티브 요율입니다.


특성화하려는 대상에 따라 : 사전에 진실을 알고있는 설정의 테스트 또는 결과가 주어진 후의 테스트 후 확률을 결정하려고합니다.
kd4ttc

3

"긍정적"과 "부정적"이 당면한 문제에 적합하지 않은 경우 이것이 의미가없는 경우에는 해당되지 않습니다. "긍정적"과 "부정적"이 순서 또는 연속 변수에 대한 임의의 강제 선택 인 많은 문제가 있습니다. FP, TP, sens, spec은 전혀 또는 전혀없는 현상에만 유용합니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.