귀하의 질문에 대한 빠른 한 문장의 대답을 믿습니다.
변수 Y를 제어하는 것이 언제 적절합니까?
"백도어 기준"입니다.
유대 진주의 구조적 인과 모델은 어떤 변수가 다른 변수에 대한 인과 적 영향을 추론하기 위해 어떤 변수가 컨디셔닝에 충분한 지 (필요한 경우) 확실하게 알 수 있습니다. 즉, 이것은 백도어 기준을 사용하여 답변되며, 이는 Pearl 이이 검토 논문의 19 페이지에 설명되어 있습니다.
주요 경고는 변수 간의 인과 관계 (그래프에서 방향 화살표의 형태)를 알아야한다는 것입니다. 그 주위에 방법이 없습니다. 어려움과 가능한 주관성이 작용할 수있는 곳입니다. Pearl의 구조적 인과 관계 모델을 사용하면 인과 관계 모델 (예 : 직접 그래프)을 통해 올바른 질문에 답하는 방법, 데이터 분포를 통해 가능한 인과 관계 모델 세트 또는 올바른 실험을 수행하여 인과 관계를 찾는 방법을 알 수 있습니다. 데이터 분포만으로 올바른 인과 구조를 찾는 방법을 알려주지는 않습니다. 실제로 변수의 의미에 대한 외부 지식 / 직관을 사용하지 않고서는 이것이 불가능하다고 주장합니다.
백도어 기준은 다음과 같이 명시 할 수 있습니다.
의 인과 관계에 미치는 영향 찾으려면 에 Y를 , 변수의 집합 노드 S가 모두 다음 기준이 충족만큼 조건으로 할 충분합니다 :XY,S
1) 어떤 원소도 X 의 자손이 아닙니다.SX
2) 는 X 와 Y 사이의 모든 "후문"경로를 차단 합니다SXY
여기서 "백도어"경로는 단순히 에서 시작 하여 X를 가리키는 화살표로 끝나는 화살표의 경로입니다 . (다른 모든 화살표가 가리키는 방향은 중요하지 않습니다.) "차단"은 그 자체로 특정 의미를 갖는 기준이며, 이는 위 링크의 11 페이지에 나와 있습니다. 이것은 "D- 분리"에 대해 배울 때 읽는 것과 동일한 기준입니다. 저는 개인적으로 주교의 패턴 인식 및 기계 학습의 8 장 에서 위에 링크 된 Pearl 소스보다 D- 분리에서의 차단 개념이 더 잘 설명되어 있음을 발견했습니다 . 그러나 다음과 같이 진행됩니다.YX.
노드 집합 블록 사이의 경로 X 및 Y 경우 만족 다음 조건 중 적어도 하나 :S,XY
1)도되는 경로의 노드의 일 방출하여이 경로에 적어도 하나의 화살표 (즉, 화살표) 떨어진 노드에서 가리키는S,
2) 안에서는없는 노드 도의 노드의 조상 S는 ) 접근전을 충족 (그것을 향해, 즉 "충돌"경로를 갖는 두 개의 화살표SS
이것은 인 또는 인 일반 백도어 기준 달리 기준 및 기준.
백도어 기준에 대해 명확하게 말하면, 주어진 인과 모델에 대해 충분한 변수를 조정할 때 데이터의 확률 분포에서 인과 적 영향을 알 수 있다는 것입니다. (알다시피, 여러 분포의 인과 구조가 동일한 분포를 담당 할 수 있기 때문에 관절 분포만으로는 인과 적 행동을 찾기에 충분하지 않습니다. 이것이 인과 모형도 필요한 이유입니다.) 분포는 일반적인 통계 / 관측 데이터에 대한 기계 학습 방법. 당신이 아는 한 인과 구조가 변수 (또는 변수 세트)를 조절할 수 있기 때문에 한 변수가 다른 변수에 미치는 영향의 추정치는 통계적 방법을 통해 얻은 데이터 분포의 추정치만큼 좋습니다.
다음은 백도어 기준을 두 다이어그램에 적용 할 때 찾은 내용입니다.
두 경우 모두 에서 X 로의 백도어 경로가 없습니다 . 따라서 Y는 "모든"백도어 경로를 차단하지 않습니다. 그러나, 좌측 도면에서, Y는 직접적인 자손 X , 그렇지 오른쪽 도면에있다. 따라서 Y 는 오른쪽 다이어그램의 백도어 기준을 따르지만 왼쪽은 아닙니다. 이것은 놀라운 결과입니다.ZX.YYX,Y
그러나 놀라운 점 은 오른쪽 그림에서 완전한 그림 이라면 X 가 Z 에 미치는 인과 적 영향을 얻기 위해 를 조건으로 할 필요가 없다는 것입니다 . (다른 방법으로, 상기 널 값 때문에 직관적으로 이것이 사실 세트 만족 백 도어 기준, 따라서이며, 조절하기에 충분.)를 X이 그와 연결되지 않은 Y 너무 오버 할 수 있습니다 단순히 평균 충분한 데이터를 값 Y는 효과 배척하는 Y 에 Z를 . 이 점에 대한 한 가지 반대 의견은 데이터가 제한되어 있으므로 대표 분포가 없다는 것입니다.YXZXYYYZ. 값. 그러나 백도어 기준은 데이터의 확률 분포가 있다고 가정합니다. 이 경우 Y를 분석적으로 주 변화 할 수 있습니다 . 유한 데이터 세트에 대한 한계 화는 추정 일뿐입니다. 또한,이 주 것을매우가능성이 전체 사진입니다. X 에 영향을 미치는 외부 요인이있을 수 있습니다 . 이러한 요소가어떤 식 으로든 Y 와 관련이있는경우 Y를 조정해야하는지 또는 충분한지 확인하기 위해 더 많은 작업을 수행해야합니다. Y 에서 X 를가리키는 다른 화살표를 그리면 Y 를 제어해야합니다.YY.X.YYYXY
물론 이것은 가 언제 통제 될 수 있는지 또는 통제 할 수 없는지 를 직감으로 알 수있는 매우 간단한 예 입니다. 그러나 다이어그램을 보면 명확하지 않은 몇 가지 예가 더 있으며 백도어 기준을 사용할 수 있습니다. 다음 다이어그램 에서 X 가 Z 에 미치는 인과 적 영향을 결정할 때 Y 를 제어하기에 충분한 지 묻습니다 .YYXZ.
가장 먼저 알아 두어야 할 것은 두 경우 모두 는 X 의 자손이 아닙니다 . 그래서 그것은 그 기준을 통과합니다. 다음으로 주목해야 할 것은 두 경우 모두 Z 에서 X 까지 여러 백도어 경로가 있다는 것 입니다. 왼쪽 다이어그램에서 2 개, 오른쪽에서 3 개YX.ZX.
왼쪽 다이어그램에서 백도어 경로는 및 Z ← W → B ← A → X 입니다.Z←Y→XZ←W→B←A→X. 는 경로에 직접있는 화살표 방출 노드이므로 첫 번째 경로를 차단합니다. Y는 또한블록이 아니하므로 제 2 경로 B , 도 그것의 하위 B , 경로 만 충돌 화살표 노드이다. 따라서 Y 는 컨디셔닝에 충분한 세트입니다. (참고 달리하여그 경로를 차단하지 않기 때문에 우측 도면, 널 세트는 컨디셔닝 불충분 Z ← Y → X를 ).YY B,B,YZ←Y→X
오른쪽 다이어그램에서 백도어 경로는 왼쪽 과 동일 하며 경로 Z←W→B→Y→X. 는경로에서 화살표 방출 노드이기 때문에이 경로를 차단하지 않습니다. 또한왼쪽 다이어그램과 같은 이유로경로 Z ← Y → X 를차단합니다. 그러나, 않는하지경로 블록 Z를 ← W → B ← → X , 이는 충돌체 노드의 직계 때문에 B . 따라서컨디셔닝에는충분하지 않습니다.Y Z←Y→XZ←W→B←A→X,B.
X 와 Z에 각각 영향을 미치는 외생 변수 A 와 W로 인해 가 왼쪽 다이어그램에서 컨디셔닝에 충분한 이유를 보는 것은 매우 직관적이지 않습니다 . 그러나 B 가 없다고 가정하십시오 . 이 경우, 외인성 변수로 인해 X 와 Z 사이에 가짜 관계 가 없으므로 걱정할 필요가 없습니다. 의 존재 B , 그러나, 문제 박았. B 가 어떤 값을 취할 수 있다면 A 와 W 가 주어지면 자연스럽게 걸립니다.YAWXZB.XZB,BAW중요한 변수 나 그것들을 결정하는 외인성 변수에 영향을 미치지 않기 때문에 문제가되지 않습니다. 그러나 (또는 그 하위 항목 중 하나)가 제어 되면 실제로 A 와 W를 종속적으로 렌더링 하여 원하지 않는 X 와 Z 사이의 가짜 관계를 만듭니다 . 링크 된 출처에서 언급 한 바와 같이, 이것은 두 개의 독립적 인 출처로 인한 변수의 관찰이 그 출처를 의존하게 만드는 Berkson의 역설 의 예입니다 (예 : 두 개의 독립적 인 동전 뒤집기의 결과는 총 수의 관찰에 의존합니다) 머리가 뒤집 혔습니다).BAWXZ
백도어 기준을 사용하기 전에 언급했듯이 인과 관계 모델 (예 : 변수 사이의 "올바른"화살표 다이어그램)을 알아야합니다. 그러나 Structural Causal Model은 이러한 모델을 검색하거나 검색이 쓸데없는시기를 알 수있는 가장 좋고 공식적인 방법을 제공한다고 생각합니다. 또한 "혼란", "중재"및 "스퓨리어스"(모두 혼동되는)와 같은 용어를 렌더링하는 데있어 부작용이 있습니다. 그림을 보여 주시면 어떤 서클을 제어해야하는지 알려 드리겠습니다.