신호 감지 이론에서 파생 된 메트릭을 사용하지 않고 신호 감지 데이터를 분석하는 것이 유효합니까?


14

신호 검출 실험은 일반적으로 관찰자 (또는 진단 시스템)에 신호 또는 비 신호를 제시하고, 관찰자는 제시된 아이템이 신호인지 또는 비 신호인지를보고하도록 요청 받는다. 이러한 실험은 2x2 행렬을 채우는 데이터를 산출합니다. 대체 텍스트

신호 탐지 이론은 "신호 / 비 신호"결정이 신호 시험이 일반적으로 비 신호 시험보다 높은 값을 갖는 신호 연속성을 기반으로하는 시나리오를 나타내는 것과 같은 데이터를 나타내며 관찰자는 단순히 "신호"를보고 할 기준 값을 선택합니다.

대체 텍스트

위의 다이어그램에서 녹색 및 빨간색 분포는 각각 "신호"및 "비 신호"분포를 나타내며 회색 선은 주어진 관찰자가 선택한 기준을 나타냅니다. 회색 선의 오른쪽에서 녹색 곡선 아래 영역은 적중을 나타내고 빨간색 곡선 아래 영역은 허위 경보를 나타냅니다. 회색 선의 왼쪽에서 녹색 곡선 아래 영역이 누락을 나타내고 빨간색 곡선 아래 영역이 올바른 거부를 나타냅니다.

상상할 수 있듯이,이 모델에 따르면 위의 2x2 표의 각 셀에 해당하는 응답 비율은 다음과 같이 결정됩니다.

  1. 녹색 및 적색 분포에서 추출 된 시험의 상대적 비율 (기본 속도)
  2. 관찰자가 선택한 기준
  3. 분포 사이의 분리
  4. 각 분포의 분산
  5. 분포 사이의 분산 평등에서 벗어난 경우
  6. 각 분포의 모양 (위의 가우시안 임)

관찰자가 여러 가지 다른 기준 수준에서 결정을 내릴 수 있도록함으로써 # 5와 # 6의 영향을 평가할 수있는 경우가 많으므로 현재는 무시할 것입니다. 또한 # 3과 # 4는 서로에 대해서만 의미가 있습니다 (예 : 분포의 변동성에 비해 분리가 얼마나 큰가?), "구별 력"(d '라고도 함)의 척도로 요약됩니다. 따라서, 신호 검출 이론은 신호 검출 데이터로부터 기준 및 판별 성의 두 가지 특성의 추정을 제공합니다.

그러나 연구 보고서 (특히 의료 분야)가 신호 감지 프레임 워크를 적용하지 않고 "긍정적 예측 값", "부정적 예측 값", "민감도"및 "특이성"과 같은 수량을 분석하려고 시도하는 경우가 종종 있습니다. "는 모두 위의 2x2 표와 다른 한계 값을 나타냅니다 ( 자세한 내용은 여기 참조 ).

이러한 한계 속성은 어떤 유틸리티를 제공합니까? 나는 그들이 이론적으로 독립적 인 기준과 차별성의 영향을 혼란스럽게하기 때문에 그것들을 완전히 무시하는 경향이 있지만, 아마도 그들의 이점을 고려할 수있는 상상력이 부족할 수도있다.


기준을 어떻게 추정 할 수 있습니까? 예를 들어 만성 피로 증후군 진단에 대한 한 의사의 기준은 다른 환자의 것과 다를 수 있지만, 당신이 추정 할 수있는 그런 종류의 것을 볼 수는 없습니다 .
onestop

질문과 관련이 없으며 텍스트에 대한 몇 가지 순진한 질문 만 있습니다. : : "분포 사이의 분리"를 어떻게 정의하고 분포의 분산의 부가 가치는 무엇입니까? 분포가 가우시안이 아닌 경우 어떻게해야합니까? 총 변동 거리에 대해 들어 보셨습니까?
로빈 지라드

답변:


3

PPV (Positive Predictive Influence)는 두 가지 메커니즘 (분별 성 및 응답 편향)을 혼동 할뿐만 아니라 항목 기본 속도로 인해 좋은 측정 방법이 아닙니다. 항목 기본 요율을 설명하는 P (signal | "yes")와 같은 사후 확률을 사용하는 것이 좋습니다.

(에스나는|와이이자형에스)=(에스나는)(H나는)(에스나는)(H나는)+(영형나는에스이자형)(에프에스이자형아르 자형미디엄)

하지만 ... 뭐가 좋은가요 ?? 특정 결과의 확률을 최대화 / 최소화하기 위해 응답 기준을 조정하는 데 유용합니다. 따라서 응답 바이어스의 변화 결과를 요약하는 데 도움이된다는 점에서 감도 및 응답 바이어스 측정 값을 보완합니다.

충고 한마디 : 기본적으로 d '와 같은 감도 측정 만 허용하는 2x2 결과 매트릭스를 고수하는 경우 SDT에 신경 쓰지 않고 Hits-False Alarms 만 사용하십시오. 두 측정 값 (d '및 (HF))은 .96의 상관 관계를 갖습니다 (BS 탐지 이론가가 무엇을하더라도 상관 없음)

이것이 건배에 도움이되기를 바랍니다.


2x2 결과 매트릭스 대신 어떤 유형의 확장 된 결과 측정 값을 염두에 두셨습니까? d '와 Hit Rate-False Alarm Rate 간의 상관 관계에 대한 마지막 클레임의 출처를 제공 할 수 있습니까?
Speldosa

2

"알려진 유병률과 테스트 기준으로 긍정적 인 테스트 결과가 정확할 확률은 얼마입니까?" "이 유형의 다양한 신호에 대한 알려지지 않은 시스템의 감도와 바이어스는 무엇입니까?"

두 사람 모두 비슷한 이론을 사용하지만 실제로는 매우 다른 목적을 가지고있는 것 같습니다. 의학적 검사 기준은 관련이 없습니다. 많은 경우에 알려진 값으로 설정할 수 있습니다. 따라서 테스트 기준을 결정하는 것은 무의미합니다. 신호 감지 이론은 기준을 알 수없는 시스템에 가장 적합합니다. 또한, 유병률 또는 신호는 고정 된 (종종 매우 작은) 값인 경향이 있습니다. SDT를 사용하면 종종 몇 가지 간단한 설명 자로 매우 복잡한 상황을 모델링하는 다양한 신호에 대한 평균 d '를 계산합니다. 기준과 신호가 모두 알려진 양으로 고정되면 SDT가 흥미로운 것을 말해 줄 수 있습니까? 근본적으로 간단한 문제를 다루는 것은 수학적 정교함과 같습니다.


2

이것은 지나치게 단순화 된 것일 수도 있지만, 특이성과 감도는 성능의 척도이며 신호의 특성에 대한 객관적인 지식이 없을 때 사용됩니다. 밀도 대 신호도 플롯은 신호 성을 정량화하는 하나의 변수를 가정합니다. 매우 높은 차원의 데이터 또는 무한한 차원의 데이터의 경우 신호 생성 메커니즘에 대한 엄격하고 입증 가능한 이론이없는 경우 변수 선택은 중요하지 않습니다. 문제는 그러한 변수를 선택한 후 왜 신호 및 비 신호에 대한 평균 및 분산과 같은 통계적 속성이 정량화되지 않는지에 대한 것입니다. 대부분의 경우 변수는 정규, 포아송 또는 지수 분포가 아닙니다. 비모수적일 수도 있는데,이 경우 분산 등의 평균 차이로 분리를 정량화합니다. 이해가되지 않습니다. 또한 생물 의학 분야의 많은 문헌이 응용 분야에 중점을두고 있으며 ROC, 특이성 감도 등이 문제의 제한된 성격 측면에서 접근법을 비교하기위한 객관적인 기준으로 사용될 수 있으며 기본적으로 그 전부입니다. 필요합니다. 때때로 사람들은 설명에 관심이 없을 수도 있습니다. 예를 들어 질병에 걸린 대상과 대조 대상에서 유전자 1 대 유전자 2 전 사체 풍부 비의 실제 이산 버전 로그 감마 분포는 오히려 이것이 중요한지 여부와 차이가 얼마나 큰지에 달려 있습니다 표현형 또는 질병 확률이 설명합니다. 문제의 제한된 본성 측면에서 접근법을 비교하기위한 객관적인 기준으로 사용될 수 있으며, 기본적으로 필요한 전부입니다. 때때로 사람들은 설명에 관심이 없을 수도 있습니다. 예를 들어 질병에 걸린 대상과 대조 대상에서 유전자 1 대 유전자 2 전 사체 풍부 비의 실제 이산 버전 로그 감마 분포는 오히려 이것이 중요한지 여부와 차이가 얼마나 큰지에 달려 있습니다 표현형 또는 질병 확률이 설명합니다. 문제의 제한된 본성 측면에서 접근법을 비교하기위한 객관적인 기준으로 사용될 수 있으며, 기본적으로 필요한 전부입니다. 때때로 사람들은 설명에 관심이 없을 수도 있습니다. 예를 들어 질병에 걸린 대상과 대조 대상에서 유전자 1 대 유전자 2 전 사체 풍부 비의 실제 이산 버전 로그 감마 분포는 오히려 이것이 중요한지 여부와 차이가 얼마나 큰지에 달려 있습니다 표현형 또는 질병 확률이 설명합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.