ROC 곡선 분석에서 공변량 조정


20

이 질문은 상관 척도의 존재 하에서 이진 종점을 예측하기 위해 다차원 스크리닝 설문지에서 컷오프 점수를 추정하는 것에 관한 것입니다.

알코올 중독 검사에 사용될 수있는 측정 척도 (개인 특성)의 각 차원에서 컷오프 점수를 고안 할 때 관련 하위 점수를 제어하는 ​​데 관심이있었습니다. 즉,이 특정한 경우에, 사람은 외부 공변량 (예측 자)에 대한 조정에 관심이 없었으며, 이는 공변량으로 조정 된 ROC 곡선 (예 : (1-2))에서 (부분) 영역으로 이어지지 만 본질적으로 다른 점수에 대해서는 같은 설문지에서 서로 연관되기 때문에 (예 : "감지 추구"와 "임피던스"). 왼쪽에는 관심 점수 (컷오프를 찾고있는 점수)와 동일한 설문지에서 계산 된 다른 점수를 포함하는 GLM을 작성하는 반면, 오른쪽에는 결과가 음주 상태 일 수 있습니다.

(@robin 요청에 따라) 명확하게하기 위해, 우리가 점수, 예를 들어 x j (예를 들어, 불안, 충동, 신경증, 감각 추구)를 가지고 있고, 차단 값 t j (즉, 긍정적 인 경우) 를 찾고 싶다고 가정하자 "경우 의 X J > t의 J '그들 각각 음극 케이스"는 달리). 우리는 일반적으로 그러한 차단을 고안 할 때 (ROC 곡선 분석을 사용하여) 성별이나 연령과 같은 다른 위험 요소를 조정합니다. SS가 IMP와 관련이있는 것으로 알려져 있기 때문에 성별, 연령 및 감각 추구 (SS)에 대한 임펄스 (IMP) 조정은 어떻습니까? 즉, 연령, 성별 및 불안 수준의 영향이 제거 된 IMP에 대한 컷오프 값을 갖게됩니다.j=4엑스jj엑스j>j

컷오프는 가능한 한 단순하게 유지되어야한다는 말과는 별개로 나의 반응은

공변량에 대해서는 예측 성능이 향상되는지 확인하기 위해 조정 여부에 관계없이 AUC를 추정하는 것이 좋습니다. 여기에서 공변량은 동일한 측정 도구로 정의 된 다른 하위 점수에 불과하며 이러한 상황에 직면 한 적이 없습니다 (보통 나이 또는 성별과 같은 알려진 위험 요소를 조정합니다). [...] 또한 예후 문제 (예 : 설문지의 선별 효능)에 관심이 있기 때문에 긍정적 예측 값 (PPV, 올바르게 분류 된 양성 검사 결과를 가진 환자의 확률)을 추정하는 데 관심이있을 수 있습니다. 설문지의 하위 점수에 따라 과목을 "긍정적"또는 "부정적"으로 분류 할 수 있습니다. 그러나

가능한 경우 관련 논문에 대한 링크를 통해이 특정 상황에 대해 더 철저히 이해하고 있습니까?

참고 문헌

  1. Janes, H and Pepe, MS (2008). 진단, 스크리닝 또는 예후 마커 연구에서 공변량 조정 : 새로운 환경에서의 오래된 개념 . 미국 역학 저널 , 168 (1) : 89-97.
  2. Janes, H and Pepe, MS (2008). ROC 분석에서 공변량 수용 . UW 생물 통계학 작업 용지 시리즈 , 용지 322.

나는 전문가는 아니지만 "측정 척도의 각 차원에서 컷오프 점수를 결정할 때 관련 하위 점수를 제어하는"문장이 약간 난해하다는 문장을 발견했습니다. 한 줄 더 설명해 주시겠습니까 (그렇지 않으면 질문을 이해하기 어렵다는 것을 알았습니다)?
로빈 지라드

j=4j엑스j>j

최종 목표가 설문 관련 질문에 대한 [상관 된] 답변을 고려하여 이진 값을 예측하는 것이라면 표준 이진 분류 문제와 매우 비슷합니다. 이런 식으로 생각하는 것이 적절할까요? 아니면 "컷오프 값"(내가 아는 바가없는)을 만드는 것이 매우 중요합니까?
DavidR

@DavidR 글쎄, 아이디어는 통계적 관점에서 많은 경고가 있지만 대부분의 임상의는 일하는 데 익숙하거나 선호하는 컷오프 값 ( "특정 값 이상의 위험에 처한 대상")을 결정하는 것입니다. 이 방법. (귀하의 의견을 미리 눈치 채지 못해서 죄송합니다!)
chl

답변:


7

분석을 계획 한 방식은 실제로 분석을 생각하는 것이 아닙니다. 우선 컷오프 개별 피처가 아니라 전체 예측 확률에 적용 있습니다. 단일 공변량의 최적 컷오프는 다른 공변량의 모든 수준에 따라 다릅니다. 일정 할 수 없습니다. 둘째, ROC 곡선은 개별 주제에 대한 최적의 결정을 내리는 목표를 달성하는 데 아무런 역할을하지 않습니다 .

상관 척도를 처리하기 위해 도움이되는 많은 데이터 축소 기술이 있습니다. 그중 하나는 공식 예측 중복 분석으로, 각 예측 변수는 다른 모든 예측 변수로부터 비선형 적으로 예측됩니다. 이것은 redunR Hmisc패키지 의 기능으로 구현 됩니다. 변수 클러스터링, 주성분 분석 및 요인 분석이 다른 가능성입니다. 그러나 분석의 주요 부분은 좋은 확률 모델 (예 : 이진 로지스틱 모델)을 구축하는 것입니다.


1
개인 대 그룹 결정에 대한 중요한 차이점은 +1입니다. 나는 당신의 응답을 기대 귀하의 회신을 부여해야 여기 나에 대한 당신의 또 다른 응답 medstats의 메일 링리스트를. 또한 진단 위험 모델을 기반으로 한 진단 유틸리티의 직접 측정에 대한 귀하의 이야기가 특히이 점에서 깨달았습니다.
chl

진단 위험 모델을 기반으로 한 진단 유틸리티의 직접 측정에 대한 대화는 이제 여기를 참조
Epifunky

3

공변량 조정 된 ROC 곡선에 관한 Janes, Pepe 기사의 요점은 추정 된 ROC 곡선 값을보다 유연하게 해석 할 수있게 해줍니다. 이는 관심 모집단의 특정 그룹간에 ROC 곡선을 계층화하는 방법입니다. 추정 된 양의 정 분율 (TPF; eq. 민감도) 및 진 음성 분율 (TNF; eq. 특이성)은 "조정 된 변수를 가진 개체들 사이에서 질병 상태를 고려한 올바른 선별 결과의 확률이 Y / N 인 것으로 해석됩니다. 명부]". 한눈에, 더 많은 마커를 패널에 통합하여 진단 테스트를 개선하는 것이 낫습니다.

이러한 방법을 조금 더 잘 이해하기위한 좋은 배경은 Cox 비례 위험 모델에 대해 읽고 "분류 및 ... 스크리닝 신뢰성 측정 값은 적합 점수를 생존 시간으로 생각하면서 생존 곡선과 많은 유사한 특성을 공유한다는 것을 알 수 있습니다. Cox 모델이 생존 곡선의 계층화를 허용하는 것처럼 계층화 된 신뢰도 측정을 제안합니다.

이것이 우리에게 중요한 이유는 바이너리 혼합 효과 모델의 맥락에서 정당화 될 수 있습니다. 당신이 마약 중독자가 될 위험을 예측하는 데 관심이 있다고 가정하십시오. SES는 이에 명백한 영향을 미치므로 어떤 식 으로든 계층화하지 않고 개인적인 행동에 기초한 진단 테스트를 평가하는 것은 어리석은 것처럼 보입니다. 부자 인 사람이 조증적이고 우울한 증상을 보였더라도 아마 절대로 시도하지 않을 것이기 때문입니다. 그러나 가난한 사람은 그러한 심리적 증상 (및 높은 위험 점수)을 갖는 위험이 훨씬 더 커질 것입니다. 위험에 대한 조잡한 분석은 두 그룹의 동일한 차이가 신뢰할 수 없기 때문에 예측 모델의 성능이 매우 좋지 않음을 나타냅니다. 그러나 계층화 (부자 대 부자)하면

공변량 조정의 포인트는 별개의 지층들 사이의 위험 모델에서 낮은 유병률과 상호 작용으로 인해 다른 그룹이 균질 한 것으로 간주하는 것입니다.


(+1) 흥미로운 답변입니다. 대단히 감사합니다. 이 글을 쓸 당시의 주요 관심사는 컷오프 값이 다소 "상호 의존적"일 것이라는 점이었습니다. 그러나 나는 (일부 유인물 발견 페페의 책 확인할 수 있습니다 여기에 그 동안을).
chl

동일한 데이터를 사용하여 의료 테스트를 개발하고 평가하는 데 문제가 있지만 수정이 쉽습니다. 어떤 종류의 교차 유효성 검사를 고려하거나 데이터를 "훈련"및 "유효성 검사"하위 집합으로 나누는 것이 좋습니다. 이는 일반적으로 진단 / 예후 / 위험 예측 모델을 개발하는 데 유효한 접근 방식입니다.
AdamO
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.