ROC 곡선에 대한 최적의 컷 포인트를 계산하는 방법을 이해하려고합니다 (감도 및 특이성이 최대화되는 값). aSAH
패키지 의 데이터 세트 를 사용하고 pROC
있습니다.
outcome
변수는 두 개의 독립 변수에 의해 설명 될 수있다 : s100b
및 ndka
. Epi
패키지 의 구문을 사용하여 두 가지 모델을 만들었습니다.
library(pROC)
library(Epi)
ROC(form=outcome~s100b, data=aSAH)
ROC(form=outcome~ndka, data=aSAH)
출력은 다음 두 그래프로 표시됩니다.
첫 번째 그래프 ( s100b
)에서 함수는 최적 컷 포인트가에 해당하는 값에 현지화되어 있다고 말합니다 lr.eta=0.304
. 두 번째 그래프 ( ndka
)에서 최적의 컷 포인트는 해당 값에 국한됩니다 lr.eta=0.335
(의 의미는 무엇입니까 lr.eta
). 내 첫 번째 질문은
- 표시된 값에 해당하는 값
s100b
과ndka
값은lr.eta
무엇 입니까 (s100b
및의 관점에서 최적의 컷 포인트는ndka
무엇입니까)?
두 번째 질문 :
이제 두 변수를 모두 고려하여 모델을 작성한다고 가정하십시오.
ROC(form=outcome~ndka+s100b, data=aSAH)
얻은 그래프는 다음과 같습니다.
기능에 의해 감성과 특이성이 극대화되는 ndka
AND 의 값이 무엇인지 알고 싶습니다 s100b
. 다른 관점에서 :의 값은 무엇인가 ndka
하고 s100b
있는 우리 셀레늄 = 68.3 % 및 SP = 76.4 % (그래프로부터 도출 된 값)가 있습니까?
이 두 번째 질문이 multiROC 분석과 관련이 있다고 가정하지만 Epi
패키지 문서 에는 모델에 사용 된 두 변수에 대한 최적 컷 포인트 를 계산하는 방법이 설명되어 있지 않습니다 .
내 질문은 reasearchGate 의이 질문과 매우 유사하게 나타납니다 .
측정의 민감도와 특이성 사이의 더 나은 균형을 나타내는 컷오프 점수를 결정하는 것은 간단합니다. 그러나 다변량 ROC 곡선 분석의 경우, 대부분의 연구자들은 AUC 측면에서 여러 지표 (변수)의 선형 조합의 전체 정확도를 결정하는 알고리즘에 중점을 두었습니다. [...]
그러나 이러한 방법은 최고의 진단 정확도를 제공하는 여러 지표와 관련된 컷오프 점수 조합을 결정하는 방법을 언급하지 않습니다.
가능한 해결책은 Shultz가 그의 논문 에서 제안한 것이지만이 기사에서는 다변량 ROC 곡선에 대한 최적의 컷 포인트를 계산하는 방법을 이해할 수 없습니다.
Epi
패키지 의 솔루션 이 이상적이지 않을 수 있으므로 다른 유용한 링크를 주시면 감사하겠습니다.