저는 현재 일부 실험실 및 약국 청구를 포함하는 대규모 건강 보험 청구 데이터를 사용하고 있습니다. 그러나 데이터 세트에서 가장 일관된 정보는 진단 (ICD-9CM)과 절차 코드 (CPT, HCSPCS, ICD-9CM)로 구성됩니다.
나의 목표는 :
- 만성 신장 질환과 같은 의학적 상태에 대해 가장 영향력있는 전구체 상태 (수용성)를 식별하십시오.
- 환자가 과거에 있었던 상태에 근거하여 의학적 상태를 개발할 가능성 (또는 확률)을 식별합니다.
- 1 및 2와 동일하지만 절차 및 / 또는 진단을 수행하십시오.
- 바람직하게는, 결과는 의사에 의해 해석 될 수있다
나는 Heritage Health Prize Milestone 논문 과 같은 것들을보고 많은 것들을 배웠지 만 입원 예측에 중점을두고 있습니다.
내 질문은 다음과 같습니다. 이와 같은 문제에 어떤 방법이 효과적이라고 생각합니까? 그리고 의료 및 임상 의학과 관련된 데이터 과학 응용 프로그램 및 방법에 대해 배우는 데 가장 유용한 리소스는 무엇입니까?
일반 텍스트 테이블을 추가하려면 # 2를 편집하십시오.
CKD는 "만성 신장 질환", ".any"는 대상 상태를 나타냅니다. ".any"는 언제라도 해당 상태를 획득했음을 나타냅니다. ".isbefore.ckd"는 CKD의 첫 진단 전에 해당 상태를 가졌음을 의미합니다. 다른 약어는 ICD-9CM 코드 그룹으로 식별 된 다른 조건과 일치합니다. 이 그룹화는 가져 오기 프로세스 중에 SQL에서 발생합니다. patient_age를 제외한 각 변수는 이진입니다.