인과 관계는 수학적으로 어떻게 정의됩니까?


16

두 랜덤 변수 사이의 인과 관계에 대한 수학적 정의는 무엇입니까?

두 확률 변수의 공동 분배의 샘플을 감안할 때 XY 우리가 말을 할 때, X 원인 Y ?

맥락에서, 나는 인과 적 발견에 관한이 논문을 읽고있다 .


2
내가 볼 수있는 한, 인과 관계는 과학적이지 않은 수학적 개념입니다. 명확히하기 위해 편집 할 수 있습니까?
mdewey

2
@mdewey 동의하지 않습니다. 인과 관계는 완전히 공식적인 용어로 현금화 될 수 있습니다. 예를 들어 내 대답을 참조하십시오.
Kodiologist

답변:


9

두 랜덤 변수 사이의 인과 관계에 대한 수학적 정의는 무엇입니까?

수학적으로 인과 모델 은 변수 간의 기능적 관계 로 구성됩니다 . 예를 들어 아래 구조 방정식 시스템을 고려하십시오.

x=fx(ϵx)y=fy(x,ϵy)

이 수단은 x 기능이 판정 값 y (만약에 개입 할 경우 x 이 값으로 변경 y 하지만 주변이 아닌 다른 방법으로). 그래픽 적으로 이것은 일반적으로 xy 표시됩니다 . 이는 x 가 y의 구조 방정식에 들어가는 것을 의미합니다 . 부록으로서, 반 사실 변수의 공동 분포 측면에서 인과 관계 모델을 표현할 수 있으며, 이는 함수 모델과 수학적으로 동일합니다 .

두 개의 랜덤 변수 X와 Y의 결합 분포 샘플을 보면 X가 Y를 일으키는 원인은 언제입니까?

때로는 (또는 대부분의 경우) 구조 방정식 fx , fy 의 모양 이나 xy 또는 yx 여부에 대한 지식이 없습니다 . 당신이 가진 유일한 정보는 공동 확률 분포 p(y,x) (또는이 분포의 표본)입니다.

이것은 귀하의 질문으로 이어집니다 : 데이터에서 인과 관계의 방향을 언제 회복 할 수 있습니까? 또는 더 정확하게 말하면 데이터에서 xy 의 구조 방정식에 입력 되는지 아니면 그 반대로 입력 되는지를 언제 복구 할 수 있습니까?

물론 인과 모델에 대해 근본적으로 테스트 할 수없는 가정이 없으면 불가능 합니다. 문제는 여러 다른 인과 모델이 관측 변수의 동일한 공동 확률 분포를 수반한다는 것입니다. 가장 일반적인 예는 가우스 잡음이있는 인과 선형 시스템입니다.

그러나 일부 인과 적 가정 하에서 이것은 가능할 수 있습니다. 그리고 이것은 인과 적 발견 문헌이 작동하는 것입니다. 이 주제에 대한 사전 노출이없는 경우 Peters, Janzing 및 Scholkopf 의 인과 적 요소 추론 뿐만 아니라 Judea Pearl의 인과 관계 2 장 부터 시작할 수 있습니다 . 우리는 여기에 원인 발견에 대한 참고 문헌에 대한 CV에 대한 주제가 있지만 아직 거기에 나열된 참조가 많지 않습니다.

따라서 귀하의 질문에 대한 답은 한 가지가 아닙니다. 하나의 가정에 달려 있기 때문입니다. 언급 한 논문은 비 가우시안 노이즈가 있는 선형 모델을 가정하는 것과 같은 몇 가지 예를 인용합니다 . 이 경우를 LINGAN (선형 비 가우시안 비순환 모델의 약자)이라고합니다. 다음은 예입니다 R.

library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1

# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat") 

# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
#     [,1]  [,2]
# [1,] .     .   
# [2,]  TRUE .     

여기서 x2x1 유발 하고 링암은 인과 관계 방향을 정확하게 회복하는 비 가우시안 잡음을 갖는 선형 인과 관계 모델을 가지고 있습니다. 그러나 이는 LINGAM 가정에 따라 결정 됩니다.

당신이 인용 한 논문의 경우, 그들은 다음과 같은 특정한 가정을합니다 ( "가정"참조) :

xy 인 경우 , X에 Y를 매핑하는 메커니즘의 최소 설명 길이는 X의 값과 무관하지만, Y에 X를 매핑하는 메커니즘의 최소 설명 길이는 Y의 값에 의존합니다.

이것은 가정입니다. 이것을 "식별 조건"이라고합니다. 본질적으로, 가정은 관절 분포 p(x,y) 에 제한을 부과 합니다. 즉, 가정은 xy 특정 제한이 데이터에 포함되고 yx 다른 제한이 유지 된다고 말합니다 . 테스트 가능한 의미를 갖는 이러한 유형의 제한 ( p(y,x) 에 제약을 부과 )은 관측 데이터에서 방향을 복구 할 수있게합니다.

마지막으로 인과 적 발견 결과는 여전히 매우 제한적이며 강력한 가정에 의존하므로 실제 상황에서 적용 할 때는주의하십시오.


1
가짜 데이터가 포함 된 간단한 예제 포함하여 어떻게 대답을 강화 할 수 있습니까? 예를 들어, 약간의 인과 적 추론 요소를 읽고 Peters의 강의를 보았으며 회귀 프레임 워크는 일반적으로 문제를 자세하게 이해해야하는 동기를 부여하는 데 사용됩니다 (ICP 작업에 대해서는 다루지 않습니다). RCM에서 멀어 지려고 노력할 때 실제 유형의 모델링 기계가 모두 빠져 있다는 인상을 받았습니다.
usεr11852는

1
@ usεr11852 질문의 내용을 이해하고 있는지 잘 모르겠습니다. 원인 발견의 예를 원하십니까? Jane이 제공 한 논문에는 몇 가지 예가 있습니다. 또한, "RCM을 피하고 실제 유형의 모델링 기계를 배제하다"는 것이 무슨 의미인지 잘 모르겠습니다.
Carlos Cinelli

1
혼란에 대한 사과, 나는 논문의 예에 관심이 없습니다. 다른 논문을 직접 인용 할 수 있습니다. (예를 들어, 신경 인과 계수에 관한 Lopez-Paz et al. CVPR 2017) 내가 관심있는 것은 누군가 R (또는 가장 좋아하는 언어)로 실행되는 가짜 데이터 가 포함 된 간단한 수치 예입니다 . 예를 들어 Peters 'et al. 책과 그들에게는 큰 도움이되는 작은 코드 스 니펫이 있습니다 (때로는 그냥 사용합니다 lm). 우리는 모두 Tuebingen 데이터 세트 관측 샘플을 사용하여 인과 적 발견에 대한 아이디어를 얻을 수있는 것은 아닙니다! :)
usεr11852는 Reinstate Monic이

1
@ usεr11852 물론 가짜 예제를 포함하여 사소한 것이지만, R에 lingam을 사용하는 것을 포함시킬 수 있습니다. 그러나 "CMM을 피하고 실제 유형의 모델링 기계를 생략"한다는 의미를 설명하고 싶습니까?
Carlos Cinelli

2
@ usεr11852 피드백에 감사드립니다. 적절한 경우 더 많은 코드를 포함 시키려고 노력할 것입니다. 마지막으로 인과 적 발견 결과는 여전히 매우 제한적이므로 상황에 따라 적용 할 때 매우주의해야합니다.
Carlos Cinelli

4

Y1Y2Y1Y2Y1=Y2

변수들 간의 인과 관계는 또한 방향성 아실 그래프 로 표현 될 수 있는데, 이는 방향 이 매우 다르지만 루빈 모델과 수학적으로 동등한 것으로 판명되었습니다 (Wasserman, 2004, 섹션 17.8).

Wasserman, L. (2004). 모든 통계 : 통계적 추론의 간결한 과정 . 뉴욕, 뉴욕 : 스프링거. ISBN 978-0-387-40272-7.


감사합니다. 관절 분포에서 나온 일련의 표본이 주어지면 어떤 시험이 될까요?
제인

3
arxiv.org/abs/1804.04622 읽고 있습니다 . 나는 그 참조를 읽지 않았습니다. 관찰 데이터를 기반으로 인과 관계가 무엇을 의미하는지 이해하려고합니다.
Jane

1
Y1Y2XY

2
(x,y=x3+ϵ)ϵ

2
관찰 사례 (질문의 경우)에서 @Jane, 일반적으로 최소한 두 가지 경우에 대해 인과 관계를 수학적으로 순수하게 추론 할 수는 없습니다. 더 많은 변수의 경우, 추가 (가상) 가정 하에서 주장 을 수는 있지만 결론에 여전히 의문을 제기 할 수 있습니다. 이 토론은 의견이 매우 길다. :)
Vimal

0

XY

  1. 대한 개입이 있습니다.XY

중재는 변수에 의존하지 않는 변수에 대한 외과 적 변화입니다. 중재는 구조 방정식과 인과적인 그래픽 모델에서 엄격하게 공식화되었지만, 아는 한 특정 모델 클래스와 독립적 인 정의는 없습니다.

  1. YX

XY

인과 관계에 대한 현대적 접근에서, 개입은 인과 관계를 정의하는 원시적 대상으로 정의된다 (정의 1). 그러나 제 생각에는 개입은 시뮬레이션 역학을 반영하며 반드시 일치해야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.