안정적인 인구 통계 기반 환자 일치에 권장되는 최소 일치 기준은 무엇입니까?


30

인구 통계 데이터를 기준으로 환자를 일치시킬 때 환자가 "동일한 환자"가되기 위해 어떤 필드가 일치해야하는지에 대한 권장 사항이 있습니까?

알고리즘이 구현마다 다를 수 있다는 것을 알고 있습니다.이 프로세스와 관련하여 모범 사례 또는 권장 사항이 있는지 궁금합니다.

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

기타?


4
아마도이 질문에 대한 대답은 특정 국가 또는 민족 및 문화적 고려 사항에 따라 변경 될 수도 있습니다. 예를 들어, 개인의 이름은 시간이 지남에 따라 이름이 변경 될 수 있기 때문에 호주 원주민에 대한 좋은 환자 식별자가 아닐 수 있습니다 (또는 경우에 따라 "무게"가 낮아야 함). 사망 한 사람과 같은 이름을 가진 호주 원주민은 죽은 사람과 같은 이름을 가진 것이 매우 나쁘다고 생각하기 때문에 포기합니다. 죽은 자의 이름이 금기라는 다른 문화에서도 비슷한 일이 일어납니다. 링크

4
그러나 아직 출판되지 않은 연구의 또 다른 예 : 미국으로의 필리핀 이민자에서 가장 흔한 열 성은 모든 사람의 약 6 %를 차지합니다. 베트남 이민자들은 ~ 60 %를 차지합니다. 이름은 베트남인보다 필리핀 인에서 훨씬 더 나은 식별자입니다. 그 연구가 가능 해지면 확실히 게시하겠습니다.

명확히하기 위해 : 두 레코드 세트와 일치시키는 것이 기본 목표입니까?

레코드를 일치 시키려고 할 때 일치 강도 ( "Bob"은 "Bob"과 매우 유사)와 가능한 일치 수 (Bob이 많음)를 구분해야합니다. 두 레코드의 이름이 같고 해당 이름의 다른 레코드가없는 경우 주소가 다르더라도 같은 사람 일 수 있습니다. 물론 큰 무리가 있다고 가정합니다.
모든 거래의 존

답변:


20

거기에 이 위대한 에세이 (스페인어, 죄송합니다) 파블로 Pazos, 2006 년부터 의료 IT 작업을하고있다 그는이 일을하는 알고리즘을 설명하는 분야에 훌륭한 기여를했다 우루과이에서 CS 엔지니어에 의해 작성.

번역기를 통해 기사를 실행할 수 있지만, 요점은 사람의 신원을 확인하기위한 기본 정보가 이름과 가족 이름 (아버지와 어머니의 이름), 성별 및 생년월일이라는 것입니다. 흥미롭게도 그는 "모든 종류의 식별자가 그의 정체성의 일부가 아니기 때문에"SSN과 같은 id 번호를 자신의 아이디 매칭 알고리즘에서 제외시킵니다 (이 시점은 논란의 여지가 있습니다). 또한 주소, 전화 번호 등과 같은 속성은 실제로 누군가의 정체성과 관련이 없으며 "누군가가 실제로 누구인지"와 관련이 없기 때문에 제외합니다.

또한 그는 다음과 같이 이전 속성 각각에 서로 다른 "가중치"를 할당합니다.

  • 이름 : 17.5 %
  • 중간 이름 : 17.5 %
  • 성 (아버지) : 17.5 %
  • 성 (어머니) : 17.5 %
  • 섹스 : 10 %
  • 직업 : 20 %

이러한 모든 속성에서 일치 항목이 발견되면 레코드 간 비교가 가능한 복합 "일치 일치 색인"을 얻는 방법을 설명합니다. 또한 이름 속성에 대한 "부분"일치는 Levenshtein 's distance 와 같은 알고리즘을 사용하여 가능합니다 .

잘 읽어보세요, IMO 스페인어로 죄송하지만 주요 아이디어를 전달할 수 있기를 바랍니다.


2
감사합니다. 또한 오타가 북미 지역에서 흔히 볼 수있는 것처럼 다양한 문화적 배경을 가진 커뮤니티에서 특히 흔하기 때문에 거리를 언급하는데도 +1입니다. 즉, 수행해야 할 대부분의 인스턴스는 가능한 값의 도메인과 일치합니다. 따라서이 경우 데이터베이스에서 단일 적중을 반환하는 신뢰할 수있는 기준 (예 : 건강 보험 번호)으로 충분합니다. 여러 항목이 반환되면 사용자에게 요청하거나 (가능한 경우) 추가 기준으로 필터링하는 경향이 있습니다.

(... 계속)이 사례는 EMR을 진료소 나 병원에, RIS를 방사선과에 국부적으로 설치하는 경우에도 적용됩니다. 이 경우 고객은 진료소 나 병원에 등록되어 있거나 등록되어 있지 않습니다. 그러나 MPI의 경우 이것은 완전히 새로운 볼 게임입니다.

13

환자 매칭을위한 하나의 마술 알고리즘은 없으며, 앞으로도 그럴 것 같지 않습니다.

우선 지역마다 차이가 있습니다. MMattoli가 지적했듯이, 미국의 한 도시 병원에서 잘 작동하는 것은 호주 원주민 병원 치료 Aborigines에 잘 맞지 않을 것입니다.

또한 개별 사이트에는 내결함성에 대한 견해가 다릅니다. 당신이 절대적으로 확실 했을 때만 일치한다면 , 당신은 많은 누락 된 경기를 얻을 것입니다. 이로 인해 환자 기록이 중복되어 다른 문제가 발생합니다. 대부분의 사이트는 정착 기꺼이 것입니다 확신 하지만 방법을 잘 과연 무엇입니까? 10 명에게 물어 보면 12 개의 답변이 제공됩니다.

따라서 "최상의"알고리즘을 구성 할 수 있으므로 고객이 필요에 맞게 조정할 수 있습니다.

일치를 고려할 때 다른 필드는 다양한 신뢰도를 제공합니다.

건강 관리 관련 식별자는 건강 시스템 내에서 사람을 고유하게 식별하는 것이기 때문에 가장 확실한 정보를 제공합니다. 병원은 보통 이들이 복제되지 않도록 고통을 겪습니다.

예 :

  • 국민 건강 ID (예 : 영국 NHS 번호)
  • 병원 지정 의료 기록 번호.

시스템에 따라 다른 환자 식별자도 높은 신뢰도를 제공 할 수 있습니다. 예를 들어, 군사 ID는 아마도 군사 병원에서 매우 관련이 있습니다.

예 :

  • 군 ID
  • 보험 ID
  • 사회 보장 번호 (미국의 경우 사회 보장 번호는 만연한 보험 사기로 인해 신뢰도가 높은 것으로 간주 되지 않습니다 .)

고유 식별자가 없으면 인구 통계 학적 정보에 의존해야합니다. 필드에서 일치하는 것은 좋지 않지만 인구 통계 학적 필드 일치가 많을수록 일치가 더 확실합니다.

자주 바뀌지 않는 사람에 관한 것들은 일치하는 데 좋습니다.

  • 이름
  • 성별
  • 생년월일

그러나 자신감을 높이기 위해 더 가혹한 정보를 고려할 수 있습니다.

  • 주소
  • 전화 번호
  • 이메일 주소

3
SSN은 또한 매우 엄격한 제한 사항을 가지고 있습니다. 예를 들어 캐나다에서는 고용 주나 은행이 아니면 요청하지 않는 것도 불법입니다 (아마도 변호사가 아닙니다). 중국과 같은 다른 곳에서는 교통량이 많은 휴일에는 기차표를 구입하기 위해 거의 모든 용도로 사용합니다.

여성 인 경우 이름 변경이 일반적입니다. 그리고 두 사람은 종종 같은 이름을 가지고 심지어 같은 장소에 살고 있습니다 (예를 들어 아들의 이름을 딴 아버지).
HLGEM

@HLGEM : 전체적으로 정확하므로 일치하는 단일 인구 통계 필드를 사용하지 않아야합니다. 그러나 사람들이 그것에 의지해야 할 때, 더 정적 인 필드 (그러나 그럼에도 때때로 변경되는)는 대안보다 더 신뢰할 수 있습니다. 그래도 좋은 것은 아닙니다.
Lynn

7

이전 성은 종종 변경되므로 확인할 수도 있습니다.


+1 "종종"은 과소 평가입니다. :) 이것은 식별 할 수 없거나 이름이없는 환자, 신생아, 잘못 식별 된 환자의 경우 일 수 있습니다. 트랜잭션이 많은 환경에서는 이름이 더 어렵지만 더 중요합니다.

4

귀하의 질문에 주어진 다음 세 가지의 명백한 조합 외에도

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

나는 phone number (Home and/or Cell)목록 에 추가 할 생각이다 . 요즘은 매우 일반적이며 모든 사람이 고유 번호를 가지며 때로는 사람들이 전화 번호를 변경하더라도 대부분의 사람들이 오래된 전화 번호를 기억하므로 편리합니다.

우리는 종종 사람들이 현지 언어를 사용하고 환자 관리 소프트웨어가 여전히 영어를 사용하는 인도와 같은 국가에서 여러 철자법과 여러 가지 렌더링 방법으로 어려움을 겪고 있음을 발견했습니다.


3

기록의 성별은 종종 이름에서 파생 된 것 같습니다. 이름에서 성별을 도출 할 수 없을 때 외국인의 성별 차이가 증가하는 것을 보았습니다.

독일에서는 'äöü'와 같은 'Umlaute'를 포함하는 이름을 가진 추가 편차가 있으며 때로는 'ae oe ue'로 대체됩니다.


1

내 생각은 다음과 같은 순서입니다 1). SSN, 성 및 이름의 첫 5 자 2). SSN, 생년월일 및 이름의 첫 5 자 3). SSN, 생년월일 및 성 4). SSN, 성별, 생년월일 5). 성, 이름, 도시 및 우편 번호의 첫 5 자


1

이것은 미국에서 정말 어려운 문제입니다. 이름은 고유하지 않으며 사람의 일생 동안 종종 변경되거나 다르게 표시됩니다 (예 : Rob 대 Robert). 더 현실적인 정보와 함께 제외하고는 환자를 식별하는 데 사용할 수 없습니다. 건강 보험 번호와 제공자는 훨씬 더 자주 변경되며 여러 가족 구성원에 대해 동일 할 수 있습니다. SSN은 유일무이하지만, 사기가 있습니다. 물론 모든 사람이 가질 수있는 운전 면허 번호와 동일합니다.

개인적으로 저는 보험 정책 번호와 생년월일과 이름 조합으로 시작한 다음 ssn과 생년월일과 이름 조합으로 시작합니다. 주소와 전화 번호를 확인하여 일치 할 때 추가 보증을 제공하지만 일치하지 않을 경우 무게가 크지 않습니다. 또한 혈액형을 알 수없는 경우 혈액형을 사용하지 않을 것입니다 (그리고 병원 뱀파이어가 혈액 샘플을 채취 할 것이라는 것을 알고 있습니다). 이름 변형 문제로 인해 이름 일치가 유사하게 일치해야합니다. 이름 신뢰도가 실제로 높은 경우 (SSN에 오타가 있었을 수도 있음) 다른 것들은 일반적으로 정확한 일치를 먼저 찾아야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.