추론 워크 플로 시각화


9

나는 공중 보건 부서에 통계적 지원을 제공합니다. 당신이 상상할 수 있듯이, 우리는 정기적으로 많은지도를 모았습니다. 저에게지도는 데이터 시각화, 가설 생성 및 확인 등에 유용한 또 다른 종류의 데이터 시각 화일뿐입니다.하지만 실제 모델링 및 가설 테스트는 종종 수행하지 않습니다 .

귀하 / 귀하의 조직은이 문제를 어떻게 해결합니까? 추론이 포함 된 워크 플로는 어떤 모양입니까? 누가 참여 했습니까? 어떤 도구를 사용하십니까? 길을 가졌다면 이상적으로 어떤 모습일까요?

감사!

편집하다

분명히, 나는 공간 데이터에서 세계의 상황에 대한 가설에 대한 공식적이고 통계적인 테스트로 나아가는 다양한 전략이 궁금합니다. 예를 들어, 결핵 검사를 늘리기 위해 교육 캠페인을 목표로한다고 가정 해 보겠습니다. 본인은 (개인적으로) 결핵의 사례를 관심있는 공변량 (예 : 평균 소득 또는 외국 출생자 비율)과 비교하여 패턴이 있는지 확인하려고합니다.

나는 어떤 것도 찾지 못할 수도 있습니다. 하지만 궁극적으로 공변량과 인구 통계의 수 사이의 연관성을 추정하기위한 모델을 만들 것입니다. 인간이없는 패턴을 찾거나 흥미롭지 않은 패턴을 찾는 데있어서 좋은 단계이기 때문에 이것은 중요한 단계입니다. 나는 이것을 스스로 수행하는 방법을 알고 있지만, 다른 조직이 어떻게 그것을 제도화하는지 궁금하다.


좋은 질문입니다!
whuber

백신 공급이 제한되어있는 일부 질병이 발생할 경우 백신을 최적으로 배포하고 있음을 보여줄 수 있도록 워크 플로우가 필요하다고 말씀하십니까?
Kirk Kuykendall

광범위하게, 나는 사람들이 어떻게 통계적 추론을 그들의 매핑 과정에 통합시키는 지에 관심이 있습니다. 당신이 묘사하는 것은 분명히 하나의 가능한 시나리오이지만, 다른 많은 시나리오가 있으며 역학의 반응에 특별히 관심이 없습니다.
매트 파커

답변:


2

매우 흥미로운 질문입니다!

첫째, 귀하의 질문은 내가 '데이터 마이닝'이라는 용어를 암시하며 여기에 일부 사람들이 얻지 못했을 수 있으므로 명시 적으로 문제를 해결할 가치가 있다고 생각합니다. 통계적으로 유효한 데이터 세트 (공간적 일 필요는 없음) 관계는 관례가 확률이 95 % 이상이어야한다는 것입니다. 그러나 20 번의 테스트를 수행하면 획득 한 '통계 학적으로 유효한'결과 중 하나 이상이 순수한 가능성으로 인한 것일 가능성이 높습니다. 따라서 데이터 세트 (GIS에서는 매핑)를 사용하여 변수 사이의 많은 가능한 관계를 시각화하고 흥미로운 것을 찾고 통계를 연결하고 이것이 유일한 테스트 인 것처럼 결과를 인용하는 나쁜 습관 했어요. 여전히 결과를 사용할 수 있지만 수행 한 테스트 수를 고려해야합니다.

그게 당신이 운전하고 있었나요?

귀하의 질문은 사람들 이이 문제를 피하는 방법을 공식화하는 것으로 보입니다. 내 대답은 당신이 언급 한 '전혀 아님'옵션이 일반적이라는 것입니다. 내 경험상 의료 통계 학자 (예 : 내 여자 친구)는 다른 분야에서 발견되는 것보다 훨씬 높은 수준의 엄격함을 적용합니다. 공중 보건 이외의 모든 데이터 매핑은 공식적인 고려없이 수행됩니다. 통계 공식이 프로세스를 제대로 이해하지 않고 맹목적으로 적용되는 문제. 지질 학적 예가 떠오른다 :

필자는 동료들이 검토 한 논문을 읽었다. 저자들은 암반이 치기 전에 파고 들었던 자갈 층의 두께와 같이 아프리카의 지질 및 공간적 영향과 관련하여 시추공 수율 (펌핑 가능한 물의 양)을 살펴 보았다. 아이디어는 시추공 시추공을 도와 최고의 시추공 장소를 목표로 삼을 수 있도록하는 것이 었습니다. 저자는 모든 종류의 변수를 결합한 데이터를 뻔뻔스럽게 채굴하여 95 % 신뢰 수준을 보이는 변수를 보았으며 리뷰어는 결과의 타당성을 의심하지 않았습니다. 그러므로 그들의 결론은 완전히 신뢰할 수 없었습니다.

관심있는 희망


설명하는 논문이 신뢰할 수없는 이유를 좀 더 설명해 주시겠습니까? 이것이 왜 그런지는 분명하지 않습니다. 관계가 통계적으로 존재하는 경우 관계를 식별하기 위해 사용한 '정신 모델'이 중요합니까? 메커니즘을 설명하지는 않지만 별도의 문제입니다.
djq
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.