인구 통계 데이터를 기준으로 환자를 일치시킬 때 환자가 "동일한 환자"가되기 위해 어떤 필드가 일치해야하는지에 대한 권장 사항이 있습니까?
알고리즘이 구현마다 다를 수 있다는 것을 알고 있습니다.이 프로세스와 관련하여 모범 사례 또는 권장 사항이 있는지 궁금합니다.
First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip
기타?
인구 통계 데이터를 기준으로 환자를 일치시킬 때 환자가 "동일한 환자"가되기 위해 어떤 필드가 일치해야하는지에 대한 권장 사항이 있습니까?
알고리즘이 구현마다 다를 수 있다는 것을 알고 있습니다.이 프로세스와 관련하여 모범 사례 또는 권장 사항이 있는지 궁금합니다.
First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip
기타?
답변:
거기에 이 위대한 에세이 (스페인어, 죄송합니다) 파블로 Pazos, 2006 년부터 의료 IT 작업을하고있다 그는이 일을하는 알고리즘을 설명하는 분야에 훌륭한 기여를했다 우루과이에서 CS 엔지니어에 의해 작성.
번역기를 통해 기사를 실행할 수 있지만, 요점은 사람의 신원을 확인하기위한 기본 정보가 이름과 가족 이름 (아버지와 어머니의 이름), 성별 및 생년월일이라는 것입니다. 흥미롭게도 그는 "모든 종류의 식별자가 그의 정체성의 일부가 아니기 때문에"SSN과 같은 id 번호를 자신의 아이디 매칭 알고리즘에서 제외시킵니다 (이 시점은 논란의 여지가 있습니다). 또한 주소, 전화 번호 등과 같은 속성은 실제로 누군가의 정체성과 관련이 없으며 "누군가가 실제로 누구인지"와 관련이 없기 때문에 제외합니다.
또한 그는 다음과 같이 이전 속성 각각에 서로 다른 "가중치"를 할당합니다.
이러한 모든 속성에서 일치 항목이 발견되면 레코드 간 비교가 가능한 복합 "일치 일치 색인"을 얻는 방법을 설명합니다. 또한 이름 속성에 대한 "부분"일치는 Levenshtein 's distance 와 같은 알고리즘을 사용하여 가능합니다 .
잘 읽어보세요, IMO 스페인어로 죄송하지만 주요 아이디어를 전달할 수 있기를 바랍니다.
환자 매칭을위한 하나의 마술 알고리즘은 없으며, 앞으로도 그럴 것 같지 않습니다.
우선 지역마다 차이가 있습니다. MMattoli가 지적했듯이, 미국의 한 도시 병원에서 잘 작동하는 것은 호주 원주민 병원 치료 Aborigines에 잘 맞지 않을 것입니다.
또한 개별 사이트에는 내결함성에 대한 견해가 다릅니다. 당신이 절대적으로 확실 했을 때만 일치한다면 , 당신은 많은 누락 된 경기를 얻을 것입니다. 이로 인해 환자 기록이 중복되어 다른 문제가 발생합니다. 대부분의 사이트는 정착 기꺼이 것입니다 확신 하지만 방법을 잘 과연 무엇입니까? 10 명에게 물어 보면 12 개의 답변이 제공됩니다.
따라서 "최상의"알고리즘을 구성 할 수 있으므로 고객이 필요에 맞게 조정할 수 있습니다.
일치를 고려할 때 다른 필드는 다양한 신뢰도를 제공합니다.
건강 관리 관련 식별자는 건강 시스템 내에서 사람을 고유하게 식별하는 것이기 때문에 가장 확실한 정보를 제공합니다. 병원은 보통 이들이 복제되지 않도록 고통을 겪습니다.
예 :
시스템에 따라 다른 환자 식별자도 높은 신뢰도를 제공 할 수 있습니다. 예를 들어, 군사 ID는 아마도 군사 병원에서 매우 관련이 있습니다.
예 :
고유 식별자가 없으면 인구 통계 학적 정보에 의존해야합니다. 한 필드에서 일치하는 것은 좋지 않지만 인구 통계 학적 필드 일치가 많을수록 일치가 더 확실합니다.
자주 바뀌지 않는 사람에 관한 것들은 일치하는 데 좋습니다.
그러나 자신감을 높이기 위해 더 가혹한 정보를 고려할 수 있습니다.
귀하의 질문에 주어진 다음 세 가지의 명백한 조합 외에도
First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code
나는 phone number (Home and/or Cell)
목록 에 추가 할 생각이다 . 요즘은 매우 일반적이며 모든 사람이 고유 번호를 가지며 때로는 사람들이 전화 번호를 변경하더라도 대부분의 사람들이 오래된 전화 번호를 기억하므로 편리합니다.
우리는 종종 사람들이 현지 언어를 사용하고 환자 관리 소프트웨어가 여전히 영어를 사용하는 인도와 같은 국가에서 여러 철자법과 여러 가지 렌더링 방법으로 어려움을 겪고 있음을 발견했습니다.
내 생각은 다음과 같은 순서입니다 1). SSN, 성 및 이름의 첫 5 자 2). SSN, 생년월일 및 이름의 첫 5 자 3). SSN, 생년월일 및 성 4). SSN, 성별, 생년월일 5). 성, 이름, 도시 및 우편 번호의 첫 5 자
이것은 미국에서 정말 어려운 문제입니다. 이름은 고유하지 않으며 사람의 일생 동안 종종 변경되거나 다르게 표시됩니다 (예 : Rob 대 Robert). 더 현실적인 정보와 함께 제외하고는 환자를 식별하는 데 사용할 수 없습니다. 건강 보험 번호와 제공자는 훨씬 더 자주 변경되며 여러 가족 구성원에 대해 동일 할 수 있습니다. SSN은 유일무이하지만, 사기가 있습니다. 물론 모든 사람이 가질 수있는 운전 면허 번호와 동일합니다.
개인적으로 저는 보험 정책 번호와 생년월일과 이름 조합으로 시작한 다음 ssn과 생년월일과 이름 조합으로 시작합니다. 주소와 전화 번호를 확인하여 일치 할 때 추가 보증을 제공하지만 일치하지 않을 경우 무게가 크지 않습니다. 또한 혈액형을 알 수없는 경우 혈액형을 사용하지 않을 것입니다 (그리고 병원 뱀파이어가 혈액 샘플을 채취 할 것이라는 것을 알고 있습니다). 이름 변형 문제로 인해 이름 일치가 유사하게 일치해야합니다. 이름 신뢰도가 실제로 높은 경우 (SSN에 오타가 있었을 수도 있음) 다른 것들은 일반적으로 정확한 일치를 먼저 찾아야합니다.