사실 세계와 개입 수준에 대한 관심의 행동 사이에는 모순이 없습니다. 예를 들어, 오늘까지 담배를 피우고 내일부터 담배를 끊으라고 강요당하는 것은 서로 "부정하다"고 말할 수 있지만 서로 모순되지 않습니다. 그러나 이제 다음 시나리오를 상상해보십시오. 폐암에 걸린 평생 흡연자 인 Joe를 알고 있습니다. 만약 30 년 동안 담배를 피우지 않았다면 오늘날 건강 할 것입니까? 이 경우 우리는 행동과 결과가 알려진 사실과 직접 모순되는 시나리오를 상상하면서 동시에 같은 사람을 다루고 있습니다.
따라서, 중재와 반 사실의 주요 차이점은 개입에서 조치를 수행하면 평균적으로 어떤 일이 발생하는지 묻는 반면, 반 상사에서는 특정 상황에서 다른 조치를 취했을 때 어떤 일이 있었는지 묻습니다. , 당신이 실제로 무슨 일이 있었는지에 대한 정보를 가지고 주어진. 실제 세계에서 발생한 일을 이미 알고 있으므로 관찰 한 증거에 따라 과거에 대한 정보를 업데이트해야합니다.
이 두 가지 유형의 쿼리는 서로 다른 수준의 정보에 응답 해야하며 (상황에는 대답하기 위해 더 많은 정보가 필요함)보다 정교한 언어를 명확하게 표현 해야 하기 때문에 수학적으로 구별 됩니다.
Rung 3 질문에 대답하는 데 필요한 정보를 사용하면 Rung 2 질문에 대답 할 수 있지만 그 반대의 방법은 아닙니다. 보다 정확하게는 중재 정보만으로는 허위 질문에 대답 할 수 없습니다. 개입 counterfactuals의 충돌이 이미 CV 여기에 주어진 일이 발생 예를 들면, 볼 이 게시물 과 이 게시물을 . 그러나 완전성을 기하기 위해 여기에도 예제가 포함됩니다.
아래의 예는 인과 관계 섹션 1.4.4 에서 찾을 수 있습니다 .
환자를 치료 ( ) 및 제어 조건 ( ) 에 무작위로 배정하고 (50 % / 50 % ), 치료 및 대조군 모두에서 50 % 회복 된 ( ) 무작위 실험을 수행했다고 가정하십시오. ) 및 50 %가 사망했습니다 ( ). 그것은 입니다.x=1x=0y=0y=1P(y|x)=0.5 ∀x,y
실험 결과는 개입의 평균 인과 관계 효과가 0임을 나타냅니다. 이것은 단계 2 질문, 입니다.P(Y=1|do(X=1))−P(Y=1|do(X=0)=0
그러나 이제 다음과 같은 질문을 해보자 . 수학적으로 을 계산하려고합니다 . P(Y0=0|X=1,Y=1)
이 질문은 귀하가 가지고있는 중재 적 데이터만으로는 대답 할 수 없습니다. 증거는 간단합니다. 나는 동일한 중재 분포를 가지지 만 다른 실제 분포를 갖는 두 가지 다른 인과 모델을 만들 수 있습니다. 두 가지가 아래에 제공됩니다.
여기서 는 환자가 치료에 어떻게 반응하는지 설명하는 관찰되지 않은 요소에 해당합니다. 예를 들어 치료 이질성을 설명하는 요소를 생각할 수 있습니다. 두 모델 의 한계 분포 가 일치합니다.UP(y,x)
첫 번째 모델에서는 아무도 치료에 영향을받지 않으므로 치료를받지 않은 상태에서 치료를 받고 사망 한 환자의 비율은 0입니다.
그러나 두 번째 모델에서는 모든 환자가 치료의 영향을 받고 평균 인과 효과가 0으로 나타나는 두 모집단이 혼합되어 있습니다. 이 예에서, 모형 2의 반상 수량은 이제 100 %로 이동합니다. 치료 중 사망 한 모든 환자는 치료를받지 않으면 회복했을 것입니다.
따라서, 렁 2와 렁 3의 명확한 구분이 있습니다. 예에서 알 수 있듯이 개입에 대한 정보와 가정만으로는 반 의상 질문에 대답 할 수 없습니다. 이것은 사실을 계산하기위한 세 단계로 명확 해집니다.
- 1 단계 (납치) : 관찰 된 증거 에 비추어 관찰되지 않은 요소 의 확률을 업데이트합니다 .P(u)P(u|e)
- 2 단계 (작업) : 모델에서 작업을 수행합니다 (예 : .do(x))
- 3 단계 (예측) : 수정 된 모델에서 를 예측 합니다.Y
인과 모델에 대한 기능 정보가 없거나 잠재적 변수에 대한 정보가 없으면 계산할 수 없습니다.