주어진 위험-결과 연관 쌍에 대해 효과 (측정) 수정 자 및 혼란 자 역할을하는 변수를 가질 수 있습니까?
나는 여전히 구별이 확실하지 않다. 차이점을 이해하는 데 도움이되는 그래픽 표기법을 살펴 보았지만 표기법의 차이점은 어리둥절합니다. 두 가지에 대한 그래픽 / 시각적 설명과 이들이 겹쳐 질 수있는시기가 유용 할 것입니다.
주어진 위험-결과 연관 쌍에 대해 효과 (측정) 수정 자 및 혼란 자 역할을하는 변수를 가질 수 있습니까?
나는 여전히 구별이 확실하지 않다. 차이점을 이해하는 데 도움이되는 그래픽 표기법을 살펴 보았지만 표기법의 차이점은 어리둥절합니다. 두 가지에 대한 그래픽 / 시각적 설명과 이들이 겹쳐 질 수있는시기가 유용 할 것입니다.
답변:
혼란스러운 변수는 다음과 같아야합니다.
변수를 잠재적 혼란 변수 로 고려하기위한 기준입니다 . 위험과 결과 사이의 관계를 실제로 혼란시키기 위해 잠재적 인 혼란자가 (계층화 및 조정 테스트를 통해) 발견되는 경우, 위험과 결과 사이에 보이는 조정되지 않은 연관은 혼란의 아티팩트이므로 실제 효과는 아닙니다.
반면에 효과 수정자는 혼란스럽지 않습니다. 효과가 실제이지만 효과의 크기가 일부 변수 X에 따라 다른 경우 해당 변수 X는 효과 수정 자입니다.
따라서 귀하의 질문에 대답하기 위해 주어진 연구 샘플과 주어진 위험 요인 및 결과 쌍에 대해 효과 수정 자 및 혼란 변수 둘 다로 작용하는 변수를 갖는 것은 불가능하다는 것을 이해합니다.
예, 변수가 혼란스럽고 효과 수정 자일 수 있습니다. R에서 빠른 시뮬레이션을 실행하여이를 확인할 수 있습니다. 가 처리이고 가 결과 인 다음 메커니즘을 고려하십시오 . 는 와 모두에 영향을 미치 므로 혼란 스럽습니다. 그러나 x 와도 상호 작용하므로 y에 미치는 영향을 수정합니다.
set.seed(234)
c <- runif(10000)
x <- c + rnorm(10000, 0, 0.1)
y <- 3*x + 2*x*c + rnorm(10000)
따라서 실제 인과 메커니즘은 입니다. 분명히 는 의 효과를 수정합니다 . 우리의 회귀 실행할 때, 에서 만, 우리는 또한 교란에서 발로 참조 :
lm(y ~ x)
Coefficients:
(Intercept) x
-0.258 4.856
마지막으로, 내 의견에서 지적했듯이 oisyutat의 정의는 잘못되었습니다. 그것은 유대 진주가 혼란자를 위해 "연관 기준"이라고 부르는 것을 반영하며,이 정의가 실패하는 이유는 여러 가지가있다. Pearl (2009), 인과 관계, 섹션 6.3을 참조하십시오.