10

표준 교육에 따르면 민감도와 특이도는 시험의 특성이며 유병률과 무관합니다. 그러나 이것은 단순한 가정이 아닌가?

내과의 해리슨의 원칙 19 에드

감도와 특이성은 유병률에 독립적 인 테스트 정확도의 매개 변수라고 오랫동안 주장되어 왔으며 많은 텍스트가 여전히이 진술을합니다. 그러나이 통계적으로 유용한 가정은 임상 적으로 단순합니다. ... 입원 환자의 경우 검사 민감도가 높을 것이고 외래 환자의 검사 특이성이 높아질 것입니다.

(유병률은 일반적으로 외래 환자보다 입원 환자에서 더 높습니다)

이 매개 변수들 사이에 수학적 또는 대략적인 그래픽 관계가 있습니까?

이 링크 조차도 그것을 '단순화'라고 부릅니다. 왜?

편집 : 감도가 어떻게 정의되는지 알고 있습니다. 답변에 언급 된 바와 같이 유병 기간은 없습니다. 본인은 이것이이 진술을 겪을 때까지 사용 된 인구의 영향을받지 않는 시험의 속성이며 따라서 질문이라고 주장했습니다. 그러나 나는이 혼란이 정의 때문이 아니라 이러한 값의 실제 계산으로 인해 발생한다고 가정합니다. 특이성과 감도는 2x2 테이블을 사용하여 계산됩니다. 여기서 참조 모집단의 유병률이 중요합니까? 그것이 그들이 말하는 것입니까? 그렇다면 기능은 무엇입니까?

— 폴리시
소스

4

@ Tim ♦와 @ gung ♦의 답변은 거의 모든 것을 다루지 만, 그것들을 하나의 것으로 합성하고 더 명확하게 설명하려고 노력할 것입니다.

인용 된 줄의 맥락은 대부분 가장 일반적인 임계 값 형태의 임상 시험을 의미 할 수 있습니다. 질병 , 라고하는 건강 상태를 포함하여 이외의 모든 것을 상상해보십시오 . 우리는 테스트를 위해 대한 좋은 예측을 얻을 수있는 프록시 측정 을 찾고 싶습니다 . (1) 절대 특이성 / 감도를 얻지 못하는 이유는 프록시 수량의 값이 완벽하게 상관되지 않기 때문입니다. 질병 상태는 일반적으로 그것과 만 연관되므로, 개별 측정에서, 우리는 그 양이 대한 임계 값을 초과 할 가능성이 있습니다 $D$ $D$ $D^c$ $D$ $D^c$ 개인과 그 반대. 명확성을 위해 가변성에 대한 가우시안 모델을 가정 해 봅시다.

를 프록시 수량으로 사용한다고 가정 해 봅시다 . 경우 좋게 선택 한 후, 보다 높아야 ( 기대 값 연산자이다). 우리가 지금 실현 때 문제가 발생 합성 상황이다 (따라서 인 실제로 심각도의 3 개 등급으로 만들어진) , , 위한 점진적으로 증가하는 기대 값과 각 . 단일 개인의 경우 범주 또는 $x$ $x$ $E[x_D]$ $E[x_{Dc}]$ $E$ $D$ $D^c$ $D_1$ $D_2$ $D_3$ $x$ $D$ $D^c$ 범주에서 '테스트'의 확률은 긍정적인지 아닌지 여부는 선택한 임계 값에 따라 다릅니다. 와 개체 를 모두 가지고있는 무작위 샘플을 연구하여 를 선택한다고하자 . 우리 일부 잘못된 긍정과 부정의 원인이됩니다. 개인을 무작위로 선택 하면 녹색 그래프로 주어진 경우 값을 지배 할 확률 과 빨간색 그래프 로 임의로 선택된 사람 의 확률을 결정 합니다. $x_T$ $D$ $D^c$ $x_T$ $D$ $x$ $D_c$

실제로 얻은 숫자는 와 개체 의 실제 숫자에 따라 달라 지지만 결과의 특이성과 감도는 그렇지 않습니다. 를 누적 확률 함수라고 하자 . 그런 다음 질병 의 유병률에 대해 일반적인 경우에 예상되는 2x2 표가 있습니다. 실제로는 결합 모집단에서 테스트가 어떻게 수행되는지 확인하려고 할 때입니다. $D$ $D^c$ $F()$ $p$ $D$

(D, +) = p (1 - F_{D} (x_{T}))

$(D,+) = p(1-F_D(x_T))$

(D c, -) = (1 - p) (1 - F_{D c} (x_{T}))

$(Dc,-) = (1-p)(1-F_{Dc}(x_T))$

(D, -) = p (F_{D} (x_{T}))

$(D,-) = p(F_D(x_T))$

(D c, +) = (1 - 피) ※ {에프}_{디 씨} ({엑스}_{티})

$(Dc,+) = (1-p)*F_{Dc}(x_T)$

실제 숫자는 의존하지만 감도와 특이성은 독립적입니다. 그러나 둘 다 및 에 의존합니다 . 따라서 이들에 영향을 미치는 모든 요소가 이러한 메트릭을 확실히 변경합니다. 예를 들어, ICU에서 근무하는 경우 는 로 대체되고 외래 환자에 대해 이야기하는 경우 로 대체됩니다 . 병원에서 유병률이 다른 것은 별개의 문제입니다. $p$ $p$ $F_D$ $F_{Dc}$ $F_D$ $F_{D3}$ $F_{D1}$ 그러나 임계 값이 정의 된 모델이 외래 환자 또는 입원 환자 인 것처럼 보이는 집단에 적용 할 수 없었기 때문에 민감도와 특이도를 다르게하는 것은 다른 보급률이 아니라 분포가 다릅니다 . 당신은 가서 분해 할 수 있습니다 의 입원 서브 파트를 변경할 수 없기 여러 부분 집단에서 도 제기하여야한다 기타 이유로 (대부분의 프록시도 있기 때문에 다른 심각한 조건에 '상승')로. 파단의 의 그 반면에 하위 집단 인구하면, 감도의 변화를 설명 인구의 변화에 대응하여 (특이성의 변화를 설명 및 $D^c$ $D^c$ $x$ $D$ $D^c$ $F_D$ $F_{Dc}$ ) .This 복합 무엇 그래프는 실질적으로 포함한다. 각 색상은 실제로 고유 한 를 가지므로 원래 감도 및 특이도가 계산 된 와 다른 경우 이러한 메트릭이 변경됩니다. $D$ $F$ $F$

예

10000 Dc, 500,750,300 D1, D2, D3을 가진 11550의 모집단을 가정하십시오. 주석 처리 된 부분은 위의 그래프에 사용 된 코드입니다.

set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))

#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')

Dc, D1, D2, D3 및 복합 D를 포함한 다양한 모집단에 대한 x- 평균을 쉽게 계산할 수 있습니다.

mean(dc) 
mean(d1) 
mean(d2) 
mean(d3) 
mean(as.numeric(d[,1]))

> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382

원래 테스트 사례에 대해 2x2 테이블을 얻으려면 먼저 데이터를 기반으로 임계 값을 설정합니다 (실제 사례에서는 @gung이 보여주는 것처럼 테스트를 실행 한 후에 설정 됨). 어쨌든 13.5의 임계 값을 가정하면 전체 모집단에서 계산할 때 다음과 같은 감도와 특이성을 얻습니다.

sdc<-sample(dc,0.1*length(dc)) 
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3))) 
threshold<-13.5 
truepositive<-sum(sdcomposite>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sdcomposite<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity<-truepositive/length(sdcomposite) 
specificity<-truenegative/length(sdc) 
print(c(sensitivity,specificity))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928  72  16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000

외래 환자와 함께 일하고 있고 D1 비율에서만 병에 걸린 환자를 받거나 D3 만받는 ICU에서 일하고 있다고 가정 해 봅시다. (보다 일반적인 경우에는 Dc 구성 요소도 분리해야합니다.) 감도와 특이성은 어떻게 달라 집니까? 유병률을 변경함으로써 (즉, 어느 경우에 속하는 환자의 상대적인 비율을 변경함으로써, 우리는 특이성과 민감성을 전혀 변경하지 않습니다.이 유병률은 또한 분포가 변함에 따라 변합니다)

sdc<-sample(dc,0.1*length(dc)) 
sd1<-sample(d1,0.1*length(d1)) 
truepositive<-sum(sd1>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd1<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity1<-truepositive/length(sd1) 
specificity1<-truenegative/length(sdc) 
print(c(sensitivity1,specificity1)) 
sdc<-sample(dc,0.1*length(dc)) 
sd3<-sample(d3,0.1*length(d3)) 
truepositive<-sum(sd3>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd3<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity3<-truepositive/length(sd3) 
specificity3<-truenegative/length(sdc) 
print(c(sensitivity3,specificity3))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  38 931  69  12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  30 944  56   0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944

요약하면, 모집단의 평균 x가 변하는 민감도의 변화 (특이성은 인구 집단에서 Dc 모집단을 구성한 경우 유사한 추세를 따를 것입니다)를 나타내는 그림입니다.

df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3))) 
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))

프록시가 아닌 경우 기술적으로 100 % 특이성과 민감도를 갖습니다. 예를 들어 , 간 생검에 대해 가 특정 객관적으로 정의 된 병리학 적 그림을 갖는 것으로 정의하면 간 생검 검사가 금 본위제가되며 민감도 자체에 대해 측정되므로 100 %가 산출됩니다. $D$

— Satwik Pasani
소스

9

첫째, 일반적으로 특이성과 독립적으로 감도를 변경할 수 없으며 그 반대의 경우도 마찬가지입니다. 이것이 ROC 곡선의 점입니다. 데이터 생성 프로세스의 특성과 특정 데이터 및 모델을 고려할 때 항상 감도와 특이성 사이에 약간의 상충 관계가 있습니다. 물론 100 % 감도와 100 % 특이성을 동시에 선호하지만 일반적으로는 할 수 없습니다. 더 나은 감도를 얻을 수는 있지만 더 낮은 특이성 또는 더 나은 특이성을 희생하지만 최악의 감도를 희생 할 수 있습니다. ROC 곡선은 선택해야하는 트레이드 오프 집합을 보여줍니다. (몇 가지 참고 사항 : 1. 데이터 집합에 차이가 있기 때문에 다른 차원을 잃지 않고 한 차원에서 얻는 것처럼 보일 수 있지만 대부분 환상적입니다 .2.ROC 곡선은 1- 특이성의 함수로서의 민감도이며, 민감도 대 특이성 그 자체는 반사 된 ROC 곡선이됩니다.)

어쨌든 겉보기 감도와 특이성은 유행에 따라 어떻게 변할 수 있습니까? 이것은 실제로 데이터가 어떻게 작동하는지보기 위해 일부 데이터를 시뮬레이션하고 재생하는 데 도움이되는 문제입니다. 모델이 특정 유병률을 갖는 상당히 큰 데이터 세트에 적합하고 임계 값이 x 축 ¹ 에 설정되어 있다고 가정 해 봅시다 . 나중에이 테스트의 성능은 서로 다른 유병률 (따라서 다른 x 값)을 갖는 샘플로 계산됩니다. 결과는 동일한 임계 값을 사용하는 동일한 모델이 다른 유병률을 가진 데이터 세트에 적용될 때 다르게 수행됩니다.

library(caret)  # we'll use these packages
library(binom)
  # we'll use this function to convert log odds to probabilities
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

##### training dataset for original model
set.seed(734)                     # these make the examples exactly reproducible
Nt = 1000
xt = rnorm(Nt, mean=5, sd=1)      # this is the distribution of X
lo = -1.386 + .308*xt             # this is the data generating process
pt = lo2p(lo)
yt = rbinom(Nt, size=1, prob=pt)
mt = glm(yt~xt, family=binomial)
summary(mt)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)    
# (Intercept) -1.16736    0.32794  -3.560 0.000371 ***
# xt           0.24980    0.06429   3.886 0.000102 ***
# ...
#     Null deviance: 1384.5  on 999  degrees of freedom
# Residual deviance: 1369.1  on 998  degrees of freedom
# AIC: 1373.1

## determine threshold
# prob(Y) = 50%, where log odds = 0, so:
-coef(mt)[1]/coef(mt)[2]  # 4.673159
threshold = 4.7  # a simple round number
classt    = ifelse(xt>threshold, 1, 0)
tabt      = table(classt, yt)[2:1,2:1]

confusionMatrix(tabt)
#       yt
# classt   1   0
#      1 346 279
#      0 175 200
#                                           
#                Accuracy : 0.546           
#                     ...                                          
#             Sensitivity : 0.6641          
#             Specificity : 0.4175          
#          Pos Pred Value : 0.5536          
#          Neg Pred Value : 0.5333          
#              Prevalence : 0.5210          


##### high prevalence dataset from hospital
set.seed(4528)
Nh = 500
xh = rnorm(Nh, mean=6, sd=1)  # a different distribution of X
lo = -1.386 + .308*xh         # but the same data generating process
ph = lo2p(lo)
yh = rbinom(Nh, size=1, prob=ph)
classh = ifelse(xh>threshold, 1, 0)  # the same threshold is used
tabh   = table(classh, yh)[2:1,2:1]

confusionMatrix(tabh)
#       yh
# classh   1   0
#      1 284 163
#      0  20  33
#                                           
#                Accuracy : 0.634           
#                     ...
#             Sensitivity : 0.9342          
#             Specificity : 0.1684          
#          Pos Pred Value : 0.6353          
#          Neg Pred Value : 0.6226          
#              Prevalence : 0.6080          


##### low prevalence dataset from outpatients
set.seed(1027)
Nl = 500
xl = rnorm(Nl, mean=3, sd=1)
lo = -1.386 + .308*xl
pl = lo2p(lo)
yl = rbinom(Nl, size=1, prob=pl)
classl = ifelse(xl>threshold, 1, 0)
tabl   = table(classl, yl)[2:1,2:1]

confusionMatrix(tabl)
#       yl
# classl   1   0
#      1   9  14
#      0 190 287
#                                           
#                Accuracy : 0.592           
#                     ...
#             Sensitivity : 0.04523         
#             Specificity : 0.95349         
#          Pos Pred Value : 0.39130         
#          Neg Pred Value : 0.60168         
#              Prevalence : 0.39800         


##### sensitivities
binom.confint(346, 521, method="e")
#   method   x   n      mean     lower    upper
# 1  exact 346 521 0.6641075 0.6217484 0.704592
binom.confint(284, 304, method="e")
#   method   x   n      mean   lower     upper
# 1  exact 284 304 0.9342105 0.90022 0.9593543
binom.confint(  9, 199, method="e")
#   method x   n       mean      lower      upper
# 1  exact 9 199 0.04522613 0.02088589 0.08411464

##### specificities
binom.confint(200, 479, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 200 479 0.4175365 0.3729575 0.4631398
binom.confint( 33, 196, method="e")
#   method  x   n      mean     lower     upper
# 1  exact 33 196 0.1683673 0.1188206 0.2282441
binom.confint(287, 301, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 287 301 0.9534884 0.9231921 0.9743417

정확한 95 % 신뢰 구간을 갖는 유병률의 함수로서의 민감도와 특이도는 다음과 같습니다.

무슨 일이야? 프로토 타입 로지스틱 회귀 분석은 아래 그림과 유사 할 수 있습니다. 모든 '동작'은 x 축의 간격 [4, 6]에서 발생합니다. 이보다 낮은 데이터는 유병률이 매우 낮으며이 모델은 차별 및 민감도가 나쁩니다. 해당 구간 이상의 데이터는 유병률이 높지만 모델을 다시 잘 식별하지 못하고 특이성이 떨어집니다.

이것이 어떻게 일어날 수 있는지 이해하기 위해 Alanine transaminase의 검사를 고려하여 환자의 간이 실패하는지 확인하십시오 ². 간은 일반적으로 ALT를 사용하지만 간 기능이 중단되면 ALT가 혈류에 버려 질 것입니다. 따라서 환자의 혈류에서 ALT 수준이 일부 임계 값을 초과하면 간이 실패했음을 의미합니다. 간부전의 유병률이 높은 샘플을 채취하면 혈액에 ALT가 높은 샘플을 채취하게됩니다. 따라서 임계 값보다 많은 환자가 생깁니다. 혈중 ALT가 높은 사람이 모두 간부전을 겪는 것은 아닙니다. 일부 환자에게는 다른 원인이있을 수 있습니다. 그러나 간부전이있는 사람은 붙잡아 야합니다. 이것은 더 높은 감도로 이어집니다. 마찬가지로, 정상 수준의 ALT를 가진 모든 환자가 건강한 간을 갖지는 않지만, 유병률이 낮은 샘플은 ALT의 수준이 낮아질 것이며, 더 많은 환자가 시험을 통과 할 것입니다. 간이없는 사람들 실패하지만, ALT 수준이 정상인 사람은 놓치게됩니다. 이로 인해 감도는 낮아 지지만 특이성이 높아집니다.

더 일반적으로, 의학적 검사의 전체 아이디어는 무언가 또는 다른 것이 직접적인 조치를 원하지만 불가능한 질병 상태의 상관 관계라는 것입니다. 상관 관계를 측정하면 질병 상태에 대한 통찰력을 얻을 수 있습니다. 이것이 사실이 아닌 (잠재적) 테스트는 가치가 없으며 사용되지 않습니다. 따라서 실제로 유병률이 높은 샘플은 더 많은 비정상 값과 상관 관계의 분포를 가져야 감도가 높아지고 그 반대도 마찬가지입니다. (상호 관계는 질병의 원인 일 필요는 없습니다. ALT 예에서는 다른 예에서 질병과 상관이 공통 원인의 영향 일 수있는 효과입니다.)

_{1. 이것은 실제로 의학에서 매우 일반적입니다. 콜레스테롤은 <200이어야하고, 수축기 혈압은 <140이어야합니다. 이러한 것 자체는 실제로 '시험'은 아니지만 그렇게 작동하는 많은 시험이 있습니다. 임계 값에 대한 (아마도) 관련된 일부 토론의 경우, 0-1 임계 값이 항상 x 축 임계 값과 같은가?에 대한 내 답변을 읽는 것이 도움이 될 수 있습니다 . 그리고 우리는 P-값 두 개의 독립적 인 데이터 세트를 비교를 사용하는 경우 왜, 샘플 크기의 독립적 인 오탐 (false positive)의 수 있습니까?

2. 본인은 의사가 아니므로이 예가 잘못 적용되었을 수 있습니다. 간 기능, 검사 및 관련 문제에 대한 정확한 정보를 원하는 경우 실제 의사에게 문의하십시오.}

— gung-복직 모니카
소스

감사! 실제로 변화한다는 것을 보여주었습니다. 그러나 @ Tim의 대답을 어떻게 고려합니까? 모순되지 않습니까?

— Polisetty

1

@Polisetty, Tim은 "입원 환자와 외래 환자는 유병률뿐만 아니라 여러 측면에서 다를 수 있으므로 다른 요인이 민감도에 영향을 줄 수 있습니다"라고 말합니다. 검사가 환자의 일부 특성 (예 : 콜레스테롤)의 함수이고 질병이 해당 특성과 (강도가 일반적으로 중요한 부분)과 강한 상관 관계가있는 경우 "다른 요인"도 함께 움직여야합니다. 유병률. 따라서, 유병률이 변할 때, 다른 변이는 상관 관계가 있고, 시험은 특정 그룹에 대해 다소의 민감성을 갖는다.

— gung-복직 모니카

7

다른 사람들이 이미 말했듯이 감도와 특이성은 유병률에 의존하지 않습니다. 민감도 는 모든 긍정의 진양의 비율이고 특이도는 모든 긍정의 진음의 비율입니다. 따라서 감도가 90 % 인 경우 테스트는 양성인 경우의 90 %에 대해 정확합니다. 분명히 작은 것의 90 %와 더 큰 것의 90 %는 여전히 90 %입니다 ...

언급 한 표 형식의 데이터를 고려할 때

\begin{array}{cc} \begin{matrix} 양 \\ 질환 \end{matrix} & \begin{matrix} 부정 \\ 질환 \end{matrix} \\ \begin{matrix} 양 \\ 테스트 \end{matrix} & ㅏ & 씨 \\ \begin{matrix} 부정 \\ 테스트 \end{matrix} & 비 & 디 \end{array}

$\begin{array}{cc} & \substack{\text{positive} \\ \text{condition}} & \substack{\text{negative} \\ \text{condition}}\\ \substack{\text{positive} \\ \text{test}} & a & c \\ \substack{\text{negative} \\ \text{test}} & b & d \\ \end{array}$

감도는 $\tfrac{a}{a+b+c+d} \,/\, \tfrac{a+b}{a+b+c+d} = \tfrac{a}{a+b}$ $p(Y \mid X) = \tfrac{p(Y \cap X)}{p(X)}$ $\tfrac{d}{a+b+c+d} \,/\, \tfrac{c+d}{a+b+c+d} = \tfrac{d}{c+d}$

그러나 인용문은 다른 말을하는 것 같습니다.

입원 환자의 경우 검사 감도가 높을 것이고 외래 환자의 경우 검사 특이성이 높아질 것입니다

따라서 저자들은 감도가 그룹마다 다르다고 말합니다. 입원 환자와 외래 환자는 유병률뿐만 아니라 여러 측면에서 다를 수 있으므로 다른 요인이 민감도에 영향을 줄 수 있다고 생각합니다. 따라서 서로 다른 데이터 세트간에 변경 이있을 수 있지만 유병률이 다르지만 변경 사항은 유포 자체 자체의 기능이 아닙니다 ( 그의 대답에서 @gung 으로 표시됨 ).

$p(\text{positive test}\mid\text{condition})$

피 (질환 ∣ 긍정적 인 테스트) \propto 피 (긍정적 인 테스트 ∣ 질환) \times 피 (질환)

$p(\text{condition}\mid\text{positive test}) \propto p(\text{positive test}\mid\text{condition})\times p(\text{condition})$

많은 경우에 사람들이 관심을 가질 확률 ( "실제로이 질환을 앓고있는 긍정적 인 검사 결과를 가진 환자는 어느 정도입니까?")이며 유병률에 따라 다릅니다. 또한 귀하의 링크 는 유병률이 긍정적 예측 가치, 즉 민감도가 아닌 사후 확률에 미치는 영향에 대해 논의합니다.

— 팀
소스

이전 답변 중 하나에서 언급했듯이, 나는 많은 텍스트가 "많은 텍스트가 여전히이 진술을하고있다"고 명시 적으로 언급했기 때문에 그것을 후 확률과 혼동하지 않았다는 것을 확신합니다. 그리고 나는 또한 해리슨만큼 신뢰할 수없는 또 다른 출처를 인용했는데, 그것은 그것이 안전한 '가정'이라고 말한다. 내가 묻고 싶은 것은 '가정'이란 무엇입니까?

— Polisetty

2

@Polisetty 저자들에게 말할 수는 없지만 인용에서, 그들은 유행에 대한 독립성을 "가정"이라고 부르는 것처럼 보이지만 이것은 오히려 수학적 사실이라고 가정합니다. 그것이 유지되지 않았다면 그것은 확률 이론이 깨졌고 그렇지 않다는 것을 의미 할 것입니다.

— Tim

민감도 및 특이성은 진단 테스트의 고정 된 속성으로 간주 될 수 있습니다. [이것은 약간 단순화되었지만 우리의 목적에 충분합니다]. -그것이 말하는 것

— Polisetty

3

true / false positive / negative rate에 대한 내 답변을 참조하십시오 .

민감도는 실제 양수 비율의 또 다른 이름이며, 특이도는 실제 음수 비율과 동일합니다. 감도와 특이성 모두 조건부 확률입니다. 그들은 환자의 질병 상태를 조절합니다. 따라서 특정 질병 상태를 가정 하고 있기 때문에 질병의 유병률 (즉, 환자에게 질병이 있을 수 있는 선험적 확률)은 관련이 없습니다 .

교과서 저자가 민감성과 특이성이 임상 적 상황에 달려 있다고 주장하는 이유에 대해서는 언급 할 수 없습니다. 이러한 경험적 관찰이 있습니까?

— tddevlin
소스

바로 그거죠. 따라서 질문입니다. 테스트의 민감도는 사용 된 인구에 따라 다릅니다. 독립적이라는 가정이 항상 사실은 아닙니다. 방법과 이유를 묻습니다. 이 책은 나중에 값도 인용한다

— Polisetty

민감도와 특이성에 영향을 미치는 모집단 별 요인이있을 수 있습니다. 그러나 민감도와 특이성의 수학적 정의에 따르면 유병률 은 적어도 직접적으로는 아니지만 이러한 요소 중 하나가 될 수 없습니다 . (그러면 수학적 정의에 대한 나의 설명에 만족한다면 내 대답을 자유롭게 받아들이십시오.)

— tddevlin

죄송합니다. 명확하지 않은 것 같습니다. 나는 감도와 유병률의 관계를 수학적으로 알고 싶었다. 나는 그들이 어떻게 정의되는지 안다. 관계가 계산 방식으로 인해 오는 것 같아요. 감도는 tp / (tp + fn)이고 유병률은 tp + fn / (tp + fn + fp + tn)

— Polisetty

P (Disease)

$P(\text{Disease})$

P (+ | disease)

$P(+|\text{disease})$

해리슨은 잘못 이해하지 못했습니다. 이 링크조차도 그것을 단순화라고 부릅니다. med.uottawa.ca/sim/data/Sensitivity_and_Prevalence_e.htm

— Polisetty

1

물론 저자의 의도에 대해 말할 수는 없지만 그 진술에 대한 나의 추론은 다음과 같습니다.

임상 상황을 진단 테스트 자체로 고려하십시오. 감도와 특이성 이 매우 좋지 않지만 테스트는 그다지 중요하지 않습니다. 병원에 있다면 병에 걸렸을 가능성이 있습니다. 병원에 있지 않으면 아프지 않을 것입니다.

이러한 관점에서, 실제 수행 진단 테스트는 실제로 시리얼에서 수행이 개 테스트의 두 번째 부분이다.

— 포미 테
소스

귀하의 설명에 따르면, 선험은 사후 확률이 커지도록 변화하고 있습니다. 사실입니다. 그러나 감도 자체가 어떻게 변하는가가 문제입니다.

— Polisetty

@Poolisetty 만약 당신이 높은 후부를 긍정적 인 테스트라고 부른다면? "임상 상황 자체는 테스트입니다." 이런 식으로 유병률에 따라 임의로 결정된 테스트를 수행 할 수 있으므로 "테스트"를보다 구체적으로 정의해야합니다. 나는 그 진술이 일부 프록시 측정의 임계 값을 기반으로 한 일반적인 다양한 테스트에 적용된다고 생각합니다.

— Satwik Pasani

1

이것은 실수 여야합니다. 필자는 아마도 저자가 긍정적이고 부정적인 예측 가치 (PPV와 NPV)가 유병률 (민감도 및 특이성)에 의존한다고 제안하려고한다고 생각한다. 이것들은 종종 진단 테스트와 임상의에게 논의되며 민감도와 특이성에 대한 원시 해석보다 더 가치가 있습니다.

이 그래프는 95 % 감도와 85 % 특이도를 가진 테스트에서 PPV와 NPV의 유병률 관계를 보여줍니다.

Mausner JS, Kramer S : Mausner 및 Bahn 역학 : 입문 텍스트. 필라델피아, WB Saunders, 1985, p. 221.

— prince_of_pears
소스

1

@Satwik, @gung 및 @Tim은 이미 많은 세부 사항을 제공했지만 기본 요소의 경우 이러한 영향을 미칠 수있는 방법에 대한 작은 예를 추가하려고합니다.

핵심 원리 : 바이어스

민감도 / 특이성 및 모든 통계적 테스트는 동일한 경고를 공유합니다. 이는 이전과 동일한 샘플링 절차를 편견없이 반복하는 경우에만 적용됩니다.

병원은 입원 정책을 사용하여 편중 샘플링을 수행하도록 설계된 기능적인 조직으로 일반 인구를 입원 및 치료가 필요한 사람들로 필터링합니다. 이것은 과학적 절차의 매우 반대입니다. 다른 인구 집단에서 테스트가 수행되는 방식을 알고 싶다면 다른 인구 집단에서 테스트해야합니다.

잠재 효과 : 상관

진단이 질병의 다른 모든 위험 요소와 독립적 / 직교하는 것은 드물기 때문에 (또는 엄격하게 현실에서 불가능한 경우) 어느 정도의 상관 관계가 있습니다.

병원 입원 화면이 진단과 양의 상관 관계가 있다면 입원 테스트를 통과 한 사람들이 진단에 의해 긍정적 인 결과를 얻는 경향이 있으며 상관 관계에 비례한다는 것을 알게 될 것입니다. 따라서 참 긍정이 풍부 해지고 거짓 긍정이 상관 관계에 비례하는 양만큼 감소합니다.

그러면 감도가 더 크게 나타납니다.

현상에 대한 설명

따라서 병원 기반 상황에서 민감도가 높을 수 있다는 관찰은 비현실적이지 않습니다. 사실 입학 정책이 잘 정립되어 있고 목적에 적합하다면 이것이 일어날 것으로 기대할 것입니다.

민감도와 특이성이 유병률과 무관하다는 가정에서 고장의 증거가 아니라 병원 입원 정책에 근거한 편향된 표본의 증거입니다.

병원이 사람들을 치료하고 과학 실험을하지 않기 때문에 분명히 좋은 것입니다.

그러나 그것은 과학자들에게 두통을줍니다.

— 르네 비
소스

민감도 또는 특이성은 유병률의 함수입니까?

예

핵심 원리 : 바이어스

잠재 효과 : 상관

현상에 대한 설명