그의 책 M. 카츠에 따르면, 다 변수 분석 (섹션 1.2, 6 페이지), " 교란 요인이 위험 인자와 연관되어 인과 결과. 관련 "왜 교란 요인이해야 인과 결과와 관련? 혼란자가 결과와 관련 되는 것으로 충분 합니까?
그의 책 M. 카츠에 따르면, 다 변수 분석 (섹션 1.2, 6 페이지), " 교란 요인이 위험 인자와 연관되어 인과 결과. 관련 "왜 교란 요인이해야 인과 결과와 관련? 혼란자가 결과와 관련 되는 것으로 충분 합니까?
답변:
왜 혼란자가 결과와 인과 관계가 있어야합니까? 혼란자가 결과와 관련되는 것으로 충분합니까?
아니요, 충분하지 않습니다.
결과 및 치료와 관련된 변수를 가질 수있는 경우부터 시작하지만,이를 제어하면 추정치가 바이어스됩니다.
예를 들어, Pearl 에서 가져온 다음과 같은 인과 관계 그래프를 고려하십시오 . 여기서 는 전처리 충돌체입니다.
이 경우 혼란스럽지 않으며 Y에 대한 X의 영향을 직접 추정 할 수 있습니다.
그러나 Z는 치료 및 결과와 관련이 있습니다. 그러나 여전히 혼란 스럽지는 않습니다. 실제로,이 경우 Z를 제어하면 추정값이 바이어스됩니다. 이 상황을 M- 바이어스 (그래프 구조로 인해)라고합니다.
여기서도 Z는 X 및 Y와 관련이 있지만 공동 설립자는 아닙니다. 당신은 그것을 통제해서는 안됩니다.
변수가 결과와 인과 관계가 있어도 반드시 혼란스러운 것은 아니라는 점에 주목할 가치가 있습니다.
아래의 간단한 그래프에서 중재자의 경우를 보자.
Y에 대한 D의 총 효과를 측정하려면 효과를 중재하는 것을 제어하지 않아야합니다.이 경우 M입니다. 즉, M은 Y와 인과 관계가 있지만, Y에 대한 D의 총 효과.
그러나 오염 을 정의 하는 것이 혼란자를 정의하는 것보다 훨씬 쉽습니다 . 의 정의에 대한보다 엄격한 설명은 confouder , 당신은 VanderWeele 및 Shpitser하여이 글을 읽는 것이 있습니다.
왜 이런 경우입니까? 여기서 기본 개념은 혼란자가 아닌 혼란 자체의 개념이기 때문입니다. 연구 질문에 대해서는 "혼란을 어떻게 제거 할 수 있습니까?" 대신 "이 변수는 혼란 스러운가?"
마지막으로, 이러한 오해가 여전히 널리 퍼져 있다고 언급 할 가치가 있습니다. 예 를 들어 2016 년 논문 에서이 인용 을 인용하십시오 .
무작위 실험 또는 강한 유사 실험 설계가 없을 때의 인과 추론은 공란 공변량으로도 알려진 치료 및 결과를 모두 예측하는 모든 전처리 변수를 적절히 조절해야합니다.
이전 예에서 보았 듯이 이것은 잘못된 것입니다. 혼란자는 "치료와 결과를 모두 예측하는 모든 전처리 변수"가 아닙니다. 모든 것을 통제하는 것은 혼란을 없애기 위해 필요하지 않을 수도 있고 결과를 편향시킬 수도 있습니다. 진주는 여기에 혼란에 대한 아주 좋은 개요가 있습니다.