심슨의 역설을 해결하는 방법?


35

Simpson의 역설은 전 세계의 입문 통계 과정에서 논의 된 고전적인 퍼즐입니다. 그러나 내 과정은 문제가 존재하고 해결책을 제공하지 않았다는 것을 간단히 언급하는 내용이었습니다. 역설을 해결하는 방법을 알고 싶습니다. 즉, 심슨의 역설에 직면했을 때, 데이터가 어떻게 분할되는지에 따라 두 가지 다른 선택이 최선의 선택이되기 위해 경쟁하는 것처럼 보이며, 어느 선택을 선택해야합니까?

문제를 구체적으로 만들기 위해 관련 Wikipedia 기사에 제공된 첫 번째 예를 살펴 보겠습니다 . 신장 결석 치료에 대한 실제 연구를 기반으로합니다.

여기에 이미지 설명을 입력하십시오

내가 의사이고 검사 결과 환자가 신장 결석을 가지고 있다고 가정합니다. 표에 제공된 정보 만 사용하여 치료 A 또는 치료 B를 채택해야하는지 여부를 결정하고 싶습니다. 석재의 크기를 알고 있다면 치료 A를 선호해야하는 것 같습니다. 우리는 치료 B를 선호해야합니다.

그러나 답을 얻는 또 다른 그럴듯한 방법을 고려하십시오. 돌이 크면 A를 선택하고, 작 으면 다시 A를 선택해야합니다. 따라서 돌의 크기를 모르더라도 경우에 따라 A를 선호해야합니다. 이것은 우리의 초기 추론과 모순됩니다.

환자가 내 사무실로 들어갑니다. 검사 결과 신장 결석이 있지만 크기에 대한 정보는 없습니다. 어떤 치료를 권합니까? 이 문제에 대한 해결책이 있습니까?

Wikipedia는 "인과적인 베이지안 네트워크"와 "후문"테스트를 사용하여 해결책을 암시하지만 이것들이 무엇인지 전혀 모른다.


2
기본 심슨의 역설 위에서 언급 한 링크는 관측 자료의 예입니다. 환자가 병원에 ​​무작위로 배정되지 않았기 때문에 병원간에 분명하게 결정을 내릴 수 없으며, 제기 된 질문은 예를 들어 한 병원이 더 높은 위험 환자를받는 경향이 있는지 여부를 알 수있는 방법을 제공하지 않습니다. 결과를 작업 AE로 분류하면 해당 문제를 해결하지 못합니다.
Emil Friedman

@EmilFriedman 저는 우리가 병원을 명확하게 결정할 수 있다는 사실에 동의합니다. 그러나 확실히 데이터는 서로를 지원합니다. (자료가 병원의 질에 대해 우리에게 아무 것도 가르쳐주지 않았다는 것은 사실이 아니다.)
Potato

답변:


14

귀하의 질문에, 당신은 "인과적인 베이지안 네트워크"와 "후문 테스트"가 무엇인지 모른다고 진술합니다.

인과적인 베이지안 네트워크가 있다고 가정합니다. 즉, 노드가 제안을 나타내고 방향 모서리가 잠재적 인과 관계를 나타내는 방향성 비순환 그래프입니다. 각 가설마다 그러한 네트워크가 많이있을 수 있습니다. 모서리 의 강도 또는 존재에 대해 설득력있는 주장을하는 세 가지 방법이 있습니다 .A?B

가장 쉬운 방법은 개입입니다. 이것이 "적절한 무작위 배정"이 문제를 해결할 것이라고 말할 때 다른 답변이 제안하는 것입니다. 무작위로 가 다른 값을 가지도록하고 를 측정 합니다. 그렇게 할 수 있다면 끝났지 만 항상 그렇게 할 수는 없습니다. 예를 들어, 사람들에게 치명적인 질병에 대해 비효율적 인 치료를 제공하는 것은 비 윤리적 일 수도 있고, 치료할 때 어떤 말을 할 수도 있습니다.BAB

두 번째 방법은 정문 방법입니다. 당신은 것을 보여주고 싶은 에 작용하여 를 통해 , 즉, . 당신이 가정하면 잠재적으로 인해 발생 있지만 다른 원인이없는, 당신은 것을 측정 할 수있는 와 상관 하고, 와 상관 , 당신은 증거를 통해 흐르는해야 결론을 내릴 수있다 . 원래 예 : 는 흡연, 는 암,B C A C B C A C A BABCACBCACABC A B CCCABC타르 축적입니다. 타르는 흡연에서만 나올 수 있으며 흡연과 암과 관련이 있습니다. 따라서 흡연은 타르를 통해 암을 유발합니다 (이 효과를 완화시키는 다른 인과 경로가있을 수 있음).

세 번째 방법은 백도어 방식입니다. "후문"으로 인해 와 가 서로 관련이 없음 을 보여 주려고합니다 ( 예 : . 인과 관계 모델을 가정 했으므로 증거가 에서 로 흐를 수있는 모든 경로 (변수를 관찰하고 그에 대한 조건화)를 차단하기 만하면 됩니다. 이러한 경로를 차단하는 것은 약간 까다 롭지 만 Pearl은 이러한 경로를 차단하기 위해 관찰해야하는 변수를 알려주는 명확한 알고리즘을 제공합니다.B A D B A BABADBAB

gung은 무작위 화가 좋으면 혼란스러운 사람들은 중요하지 않을 것입니다. 우리는 가상의 원인 (치료)에 개입하는 것이 허용되지 않는다고 가정하기 때문에, 연령 또는 신장 결석 크기와 같은 가상의 원인 (치료)과 효과 (생존) 사이의 일반적인 원인은 혼란을 초래할 것입니다. 해결책은 모든 백도어를 막기 위해 올바른 측정을하는 것입니다. 자세한 내용은 다음을 참조하십시오.

진주, 유대. "실증적 연구를위한 인과 관계 도표." Biometrika 82.4 (1995) : 669-688.


이것을 문제에 적용하려면 먼저 인과 관계 그래프를 그리겠습니다. (치료 전) 신장 결석 크기 와 치료 유형 는 모두 성공 원인입니다 . 다른 의사가 신장 결석 크기에 따라 Tratment를 할당하는 경우 는 의 원인 일 수 있습니다 . 분명히 , , 사이에는 다른 인과 관계가 없습니다 . 는 다음에 로 원인이 될 수 없습니다. 마찬가지로 는 와 뒤에옵니다 .Y Z X Y X Y Z Y X Z X YXYZXYXYZYXZXY

이후 일반적인 원인, 그것은 측정해야한다. 변수의 우주와 잠재적 인과 관계를 결정하는 것은 실험자에게 달려 있습니다. 모든 실험에 대해 실험자는 필요한 "후문 변수"를 측정 한 다음 각 변수 구성에 대한 처리 성공의 한계 확률 분포를 계산합니다. 새 환자의 경우 변수를 측정하고 한계 분포로 표시된 치료를 따릅니다. 모든 것을 측정 할 수 없거나 데이터가 많지 않지만 관계의 아키텍처에 대해 알고있는 경우 네트워크에서 "믿음 전파"(베이지 언 추론)를 수행 할 수 있습니다.X


2
아주 좋은 답변입니다. 질문에서 제시 한 예제에이 프레임 워크를 적용하는 방법을 간단히 말씀해 주시겠습니까? 예상 답변을 제공합니까 (A)?
감자

감사! "믿음의 전파"에 대한 짧은 소개를 알고 있습니까? 더 배우고 싶습니다.
감자

@ Potato : 그의 저서 "지능형 시스템의 확률 론적 추론"에서 배웠습니다. 온라인에는 많은 튜토리얼이 있지만, 단지 알고리즘을 제시하기보다는 직감을 구축하는 튜토리얼을 찾기가 어렵습니다.
Neil G

22

여기에 Simpson의 역설을 설명하는 사전 답변이 있습니다 : Basic Simpson의 역설 . 현상을 더 잘 이해하기 위해 읽는 것이 도움이 될 수 있습니다.

요컨대, 심슨의 역설은 혼란으로 인해 발생합니다. 귀하의 예에서 치료는 혼란스러워합니다.* 각 환자의 신장 결석 종류. 우리는 결과 A에서 치료 A가 항상 더 낫다는 것을 알았습니다. 따라서, 의사는 치료 A를 선택해야합니다. 치료 B가 더 잘 보이는 유일한 이유는 치료가 덜 심각한 환자에게 더 자주 제공되고 치료 A가 더 심각한 상태에있는 환자에게 제공 되었기 때문입니다. 그럼에도 불구하고, 치료 A는 두 조건 모두에서 더 잘 수행되었다. 의사는 과거에 상태가 좋지 않은 환자에게 더 나쁜 치료가 제공되었다는 사실에 신경 쓰지 않고, 환자보다 먼저 환자를 돌보며, 환자가 개선되기를 원한다면 가능한 최고의 치료법으로

* 실험 실행 및 치료 무작위 배정의 요점은 치료가 혼란스럽지 않은 상황을 만드는 것 입니다. 문제의 연구가 실험이라면 무작위 배정 과정이 공정한 그룹을 만들지 못했다고 말할 수는 있지만 관찰 연구 일 수도 있습니다.


다른 답변에서 제안한 정규화 방법을 선택하십시오. 나는 이것이 문제가있는 것을 안다. 정규화 할 때 다른 결론을 제공하는 동일한 데이터 세트의 두 파티션을 표시 할 수 있습니다. 다른 답변에 대한 답변으로 내 링크와 인용문을 참조하십시오.
감자

2
스탠포드 기사를 읽지 않았습니다. 그러나 나는 인용문에서 설득력있는 추론을 찾지 못했습니다. 일부 인구 집단에서는 치료 B가 치료 A보다 낫습니다. 이것은 중요하지 않습니다. 그것이 일부 인구 집단에 해당된다면, 인구 특성에 혼란이 있기 때문입니다. 환자 (인구가 아님)에 직면하고 있고 환자가 치료 중 개선 될 가능성이 더 높음 환자의 신장 결석이 크거나 작은 지 여부를 고려하십시오. 치료 A를 선택해야합니다.
gung-Reinstate Monica

2
젊고 오래된 파티션은 혼란 스럽습니까? 그렇지 않은 경우 문제가되지 않습니다. 그렇다면 전체 정보를 사용하여 최선의 결정을 내립니다. 우리가 현재 알고있는 것에 기초하여, '치료 B는 골재에서 가장 잘 보인다'는 붉은 청어입니다. 그것은 혼란으로 인해 발생하는 것처럼 보이지만 (통계적) 착각입니다.
gung-복직 모니카

2
신장 결석 크기와 나이를 모두 고려한 더 복잡한 테이블이 있습니다. Wikipedia 페이지 에서 버클리 성 편견 사례 를 볼 수 있습니다 .
gung-Monica Monica 복원

1
댓글을 길게 연장하는 것을 싫어하지만 역설이 항상 혼란 스럽다고 말하지는 않습니다. 그것은 혼란스러운 변수가 가질 변수 사이의 관계 때문이지만, 심슨 역설 혼란을 초래하는 모든 변수를 호출하지는 않을 것입니다 (예 : 체중 30 세와 90 세 x 감자 당 소비되는 감자 칩의 양- ... 내가 나이를 비록 혼동를 호출하지 않기 때문에 90 년짜리가 포함 된 상호 작용없이 음수가 될 수 있습니다 칩의 주요 효과로 시작하는 것이 훨씬 가볍다 (첫번째 그림을 참조 위키 백과 페이지에..)


4

하나의 예 또는 일반적으로 역설에 대한 해결책을 원하십니까? 역설은 하나 이상의 이유로 발생할 수 있으며 사례별로 평가해야하기 때문에 후자의 경우는 없다.

역설은 요약 데이터를보고 할 때 주로 문제가되고 개인에게 데이터를 분석하고보고하는 방법을 교육하는 데 중요합니다. 데이터의 패턴을 숨기거나 모호하게하는 요약 통계 나 데이터 분석가가 데이터의 실제 패턴이 무엇인지 인식하지 못하는 요약 통계를보고하지 않기를 바랍니다. 솔루션이 없으므로 솔루션이 제공되지 않았습니다.

이 특정한 경우, 테이블이있는 의사는 항상 A를 선택하고 요약 행을 무시합니다. 그들이 돌의 크기를 알고 있다면 아무런 차이가 없습니다. 데이터를 분석하는 사람이 A와 B에 대해 요약 된 행만보고했다면 의사가받은 데이터가 현실을 반영하지 않기 때문에 문제가있는 것입니다. 이 경우 요약 통계가 무엇인지 한 번의 해석으로 만 가능하기 때문에 테이블의 마지막 줄을 남겨 두었을 것입니다 (두 가지가 있습니다). 독자가 개별 세포를 해석하도록 내버려두면 일반적으로 올바른 결과를 얻었을 것입니다.

(여러분의 의견은 당신이 불평등 한 N 문제에 대해 가장 걱정하고 있고 심슨이 그것보다 더 넓다는 것을 암시하는 것 같습니다. 나는 불평등 한 N 문제에 대해 더 깊이 생각하지 않습니다. 요약 통계가 비교적 임의로 선택되었고 일부 분석가의 선택이 역설을 일으킨다는 점을 고려해야한다고 주장하고 있습니다. 있다.)


당신은 우리가 요약 라인을 무시해야한다고 주장합니다. 왜 이것이 "명확한"입니까?
감자

치료 A가 크거나 작은 돌로 더 좋으며 B는 같지 않은 N으로 인해 나오기 때문에 분명합니다. 또한 마지막 줄은 복음이 아니라 해석입니다. 해당 라인을 계산하는 방법은 두 가지 이상 있습니다. 특정 샘플에 대해 말하고 싶은 경우에만 계산합니다.
John

죄송합니다. 요약 행이 왜 잘못된 보고서인지 이해할 수 없습니다. 나는 당신의 중심점을 놓치고 있다고 생각합니다. 설명해 주시겠습니까?
감자

1
정규화 한 다음 평균화하면 "올바른"결과가 제공됩니다 (A). 그러나 이것은 불법입니다. 다음 인용문은 스탠포드 철학 백과 사전의 관련 기사에서 발췌 한
Potato

2
"Simpson 's Reversals는 전체 모집단의 연관성과 일치하는 모집단을 분할하는 많은 방법이 있음을 보여줍니다. 성별에 의한 분할은 새 치료를 제공 할 때 남성과 여성이 모두 더 나빠졌지만 동일한 모집단의 분할은 나이를 기준으로 50 세 미만의 환자와 50 세 이상의 환자 모두가 새로운 치료를 받으면 더 나아 졌다고한다. 같은 집단을 분할하는 다른 방법으로 데이터를 정규화하면 전체 집단에서 유지되는 연관성에 대한 결론을 양립 할 수 없을 것이다. "
감자

4

한 가지 중요한 "탈취"는 치료 할당이 하위 그룹간에 불균형 인 경우 데이터를 분석 할 때 하위 그룹을 고려해야한다는 것입니다.

두 번째로 중요한 "탈취"는 관찰 연구가 특히 심슨의 역설이 알려지지 않았기 때문에 오답을 제공하는 경향이 있다는 것입니다. 그 이유를 알지 못하면 치료 A가 더 어려운 경우에 제공되는 경향이 있다는 사실을 바로 잡을 수 없기 때문입니다.

적절하게 무작위 배정 된 연구에서 우리는 (1) 치료를 무작위로 배정하여 한 치료에 "불공정 한 이점"을주는 것은 가능성이 거의 없으며 데이터 분석에서 자동으로 처리 될 것입니다. (2) 중요한 이유가있는 경우 이렇게하려면 알려진 문제를 기반으로 무작위로 치료를 무작위로 할당하고 분석 중에 해당 문제를 고려하십시오.


+1, 그러나 "자동으로 처리"는 사실이 아닙니다 (적어도 즉각적인 상황에서 주로 관심이있는 상황). 장기적으로는 사실이지만 샘플링 오류로 인해 여전히 유형 I 및 유형 II 오류가 발생할 수 있습니다 (즉, 한 가지 치료 조건의 환자는 우연히 더 심각한 질병을 겪는 경향이 있음).
gung-복원 Monica Monica

그러나 우발성 테이블을 분석하고 p- 값을 계산하고 올바르게 해석 할 때 샘플링 오류의 영향이 고려됩니다.
Emil Friedman 22
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.