인과의 사다리에서 렁 2와 3의 차이점


12

유대 진주의 "이유서"에서 그는 원인의 사다리라고 부르는 것에 대해 이야기합니다. 이것은 본질적으로 다른 수준의 인과 추론으로 구성된 계층입니다. 가장 낮은 것은 관찰 된 데이터 (예 : 상관 관계, 조건부 확률 등)의 연관 패턴과 관련이 있으며, 다음은 개입에 중점을 둡니다 (데이터 생성 프로세스를 미리 지정된 방식으로 의도적으로 변경하면 어떻게됩니까?). 상반된 현상 (일어 났거나 발생하지 않은 경우 다른 가능한 세계에서 어떤 일이 발생합니까)?

내가 이해하지 못하는 것은 렁 2와 3이 어떻게 다른지입니다. 우리가 반 의상적인 질문을한다면, 단순히 관측 된 세계의 일부 측면 을 부정 하기 위해 개입에 관한 질문 을하는 것이 아닙니까?


이것이 실제로 주제입니까? 호기심 요청
Firebug

5
@Firebug는 주제에 대한 인과 관계가 있습니까? 특정 사실이 누군가의 사망에 충분한 확률과 같은 반 사실의 확률을 계산하려면이를 이해해야합니다.
Carlos Cinelli

답변:


13

사실 세계와 개입 수준에 대한 관심의 행동 사이에는 모순이 없습니다. 예를 들어, 오늘까지 담배를 피우고 내일부터 담배를 끊으라고 강요당하는 것은 서로 "부정하다"고 말할 수 있지만 서로 모순되지 않습니다. 그러나 이제 다음 시나리오를 상상해보십시오. 폐암에 걸린 평생 흡연자 인 Joe를 알고 있습니다. 만약 30 년 동안 담배를 피우지 않았다면 오늘날 건강 할 것입니까? 이 경우 우리는 행동과 결과가 알려진 사실과 직접 모순되는 시나리오를 상상하면서 동시에 같은 사람을 다루고 있습니다.

따라서, 중재와 반 사실의 주요 차이점은 개입에서 조치를 수행하면 평균적으로 어떤 일이 발생하는지 묻는 반면, 반 상사에서는 특정 상황에서 다른 조치를 취했을 때 어떤 일이 있었는지 묻습니다. , 당신이 실제로 무슨 일이 있었는지에 대한 정보를 가지고 주어진. 실제 세계에서 발생한 일을 이미 알고 있으므로 관찰 한 증거에 따라 과거에 대한 정보를 업데이트해야합니다.

이 두 가지 유형의 쿼리는 서로 다른 수준의 정보에 응답 해야하며 (상황에는 대답하기 위해 더 많은 정보가 필요함)보다 정교한 언어를 명확하게 표현 해야 하기 때문에 수학적으로 구별 됩니다.

Rung 3 질문에 대답하는 데 필요한 정보를 사용하면 Rung 2 질문에 대답 할 수 있지만 그 반대의 방법은 아닙니다. 보다 정확하게는 중재 정보만으로는 허위 질문에 대답 할 수 없습니다. 개입 counterfactuals의 충돌이 이미 CV 여기에 주어진 일이 발생 예를 들면, 볼 이 게시물이 게시물을 . 그러나 완전성을 기하기 위해 여기에도 예제가 포함됩니다.

아래의 예는 인과 관계 섹션 1.4.4 에서 찾을 수 있습니다 .

환자를 치료 ( ) 및 제어 조건 ( ) 에 무작위로 배정하고 (50 % / 50 % ), 치료 및 대조군 모두에서 50 % 회복 된 ( ) 무작위 실험을 수행했다고 가정하십시오. ) 및 50 %가 사망했습니다 ( ). 그것은 입니다.x=1x=0y=0y=1P(y|x)=0.5   x,y

실험 결과는 개입의 평균 인과 관계 효과가 0임을 나타냅니다. 이것은 단계 2 질문, 입니다.P(Y=1|do(X=1))P(Y=1|do(X=0)=0

그러나 이제 다음과 같은 질문을 해보자 . 수학적으로 을 계산하려고합니다 . P(Y0=0|X=1,Y=1)

이 질문은 귀하가 가지고있는 중재 적 데이터만으로는 대답 할 수 없습니다. 증거는 간단합니다. 나는 동일한 중재 분포를 가지지 만 다른 실제 분포를 갖는 두 가지 다른 인과 모델을 만들 수 있습니다. 두 가지가 아래에 제공됩니다.

여기에 이미지 설명을 입력하십시오

여기서 는 환자가 치료에 어떻게 반응하는지 설명하는 관찰되지 않은 요소에 해당합니다. 예를 들어 치료 이질성을 설명하는 요소를 생각할 수 있습니다. 두 모델 의 한계 분포 가 일치합니다.UP(y,x)

첫 번째 모델에서는 아무도 치료에 영향을받지 않으므로 치료를받지 않은 상태에서 치료를 받고 사망 한 환자의 비율은 0입니다.

그러나 두 번째 모델에서는 모든 환자가 치료의 영향을 받고 평균 인과 효과가 0으로 나타나는 두 모집단이 혼합되어 있습니다. 이 예에서, 모형 2의 반상 수량은 이제 100 %로 이동합니다. 치료 중 사망 한 모든 환자는 치료를받지 않으면 회복했을 것입니다.

따라서, 렁 2와 렁 3의 명확한 구분이 있습니다. 예에서 알 수 있듯이 개입에 대한 정보와 가정만으로는 반 의상 질문에 대답 할 수 없습니다. 이것은 사실을 계산하기위한 세 단계로 명확 해집니다.

  1. 1 단계 (납치) : 관찰 된 증거 에 비추어 관찰되지 않은 요소 의 확률을 업데이트합니다 .P(u)P(u|e)
  2. 2 단계 (작업) : 모델에서 작업을 수행합니다 (예 : .do(x))
  3. 3 단계 (예측) : 수정 된 모델에서 를 예측 합니다.Y

인과 모델에 대한 기능 정보가 없거나 잠재적 변수에 대한 정보가 없으면 계산할 수 없습니다.


재미있는 답변! 몇 가지 후속 조치 : 1) " Rung 3 정보를 사용하면 Rung 2 질문에 대답 할 수 있지만 다른 방법은 없습니다 "라고 말합니다. 그러나 흡연 사례에서, 조가 담배를 피우지 않았을 때 건강이 좋을지 아는 것은 '내가 30 년 동안 담배를 피우면 내일 그만두면 건강 할까?' 그들은 분명한 질문처럼 보이므로 뭔가 빠진 것 같습니다.
mkt-Reinstate Monica

또한 후속 작업 예는 처리와 제어간에 무작위로 분포되지 않은 2 개의 관찰되지 않은 변수에 의존합니다. 그러나 당신은 이것을 무작위 실험으로 묘사했습니다-이것이 무작위 무작위 배정의 경우가 아닙니까? 적절한 무작위 배정을 통해 기본적인 것이 빠지지 않는 한 두 가지 다른 결과를 얻는 방법을 알 수 없습니다.
mkt-Reinstate Monica

처음부터 @mkt. 관찰되지 않은 변수는 처리 된 것과 제어 된 것 사이에서 무작위로 분산되며, 양 팔에 u의 각 범주의 정확히 50 %가 있습니다. 정보는 특정 쿼리에 대한 답변이 아니라 일반적으로 실제 쿼리에 응답하는 데 필요한 모델의 부분 사양을 의미합니다. 허위 사실 쿼리에 답하려면 인과 구조 + 일부 기능 정보 또는 잠재 변수 분포 정보가 필요합니다.
Carlos Cinelli

0

유대 진주 가 트위터에 준 답변은 다음과 같습니다 .

독자들은 질문합니다 : 중재 (Rung-2)가 반 상식 (Rung-3)과 다른 이유는 무엇입니까? 개입이 관측 된 세계의 일부 측면을 부정하지 않습니까?

답변 중재 전후의 세계는 시차 변수를 수반하기 때문에 중재는 변화하지만 관측 된 세계와 모순되지는 않습니다. 대조적으로, "나 죽었다"는 알려진 사실과 모순된다. 최근 토론은 이 토론을 참조하십시오 .

비고 : 하버드의 #causalinference 그룹과 Rubin의 잠재적 인 결과 프레임 워크는 Rung-2와 Rung-3을 구분하지 않습니다.

나는 이것이 미래에 시정 될 문화적으로 뿌리 내린 저항이라고 믿는다. #Bookofwhy의 물리적 인 "듣기"은유와 대조적으로 "임의의 무작위"은유에서 두 프레임 워크의 기원에서 비롯됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.