두 랜덤 변수 사이의 인과 관계에 대한 수학적 정의는 무엇입니까?
두 확률 변수의 공동 분배의 샘플을 감안할 때 와 우리가 말을 할 때, 원인 ?
맥락에서, 나는 인과 적 발견에 관한이 논문을 읽고있다 .
두 랜덤 변수 사이의 인과 관계에 대한 수학적 정의는 무엇입니까?
두 확률 변수의 공동 분배의 샘플을 감안할 때 와 우리가 말을 할 때, 원인 ?
맥락에서, 나는 인과 적 발견에 관한이 논문을 읽고있다 .
답변:
두 랜덤 변수 사이의 인과 관계에 대한 수학적 정의는 무엇입니까?
수학적으로 인과 모델 은 변수 간의 기능적 관계 로 구성됩니다 . 예를 들어 아래 구조 방정식 시스템을 고려하십시오.
이 수단은 기능이 판정 값 (만약에 개입 할 경우 이 값으로 변경 하지만 주변이 아닌 다른 방법으로). 그래픽 적으로 이것은 일반적으로 표시됩니다 . 이는 가 y의 구조 방정식에 들어가는 것을 의미합니다 . 부록으로서, 반 사실 변수의 공동 분포 측면에서 인과 관계 모델을 표현할 수 있으며, 이는 함수 모델과 수학적으로 동일합니다 .
두 개의 랜덤 변수 X와 Y의 결합 분포 샘플을 보면 X가 Y를 일으키는 원인은 언제입니까?
때로는 (또는 대부분의 경우) 구조 방정식 , 의 모양 이나 또는 여부에 대한 지식이 없습니다 . 당신이 가진 유일한 정보는 공동 확률 분포 (또는이 분포의 표본)입니다.
이것은 귀하의 질문으로 이어집니다 : 데이터에서 인과 관계의 방향을 언제 회복 할 수 있습니까? 또는 더 정확하게 말하면 데이터에서 가 의 구조 방정식에 입력 되는지 아니면 그 반대로 입력 되는지를 언제 복구 할 수 있습니까?
물론 인과 모델에 대해 근본적으로 테스트 할 수없는 가정이 없으면 불가능 합니다. 문제는 여러 다른 인과 모델이 관측 변수의 동일한 공동 확률 분포를 수반한다는 것입니다. 가장 일반적인 예는 가우스 잡음이있는 인과 선형 시스템입니다.
그러나 일부 인과 적 가정 하에서 이것은 가능할 수 있습니다. 그리고 이것은 인과 적 발견 문헌이 작동하는 것입니다. 이 주제에 대한 사전 노출이없는 경우 Peters, Janzing 및 Scholkopf 의 인과 적 요소 추론 뿐만 아니라 Judea Pearl의 인과 관계 2 장 부터 시작할 수 있습니다 . 우리는 여기에 원인 발견에 대한 참고 문헌에 대한 CV에 대한 주제가 있지만 아직 거기에 나열된 참조가 많지 않습니다.
따라서 귀하의 질문에 대한 답은 한 가지가 아닙니다. 하나의 가정에 달려 있기 때문입니다. 언급 한 논문은 비 가우시안 노이즈가 있는 선형 모델을 가정하는 것과 같은 몇 가지 예를 인용합니다 . 이 경우를 LINGAN (선형 비 가우시안 비순환 모델의 약자)이라고합니다. 다음은 예입니다 R
.
library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1
# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat")
# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
# [,1] [,2]
# [1,] . .
# [2,] TRUE .
여기서 는 유발 하고 링암은 인과 관계 방향을 정확하게 회복하는 비 가우시안 잡음을 갖는 선형 인과 관계 모델을 가지고 있습니다. 그러나 이는 LINGAM 가정에 따라 결정 됩니다.
당신이 인용 한 논문의 경우, 그들은 다음과 같은 특정한 가정을합니다 ( "가정"참조) :
인 경우 , X에 Y를 매핑하는 메커니즘의 최소 설명 길이는 X의 값과 무관하지만, Y에 X를 매핑하는 메커니즘의 최소 설명 길이는 Y의 값에 의존합니다.
이것은 가정입니다. 이것을 "식별 조건"이라고합니다. 본질적으로, 가정은 관절 분포 에 제한을 부과 합니다. 즉, 가정은 특정 제한이 데이터에 포함되고 다른 제한이 유지 된다고 말합니다 . 테스트 가능한 의미를 갖는 이러한 유형의 제한 ( 에 제약을 부과 )은 관측 데이터에서 방향을 복구 할 수있게합니다.
마지막으로 인과 적 발견 결과는 여전히 매우 제한적이며 강력한 가정에 의존하므로 실제 상황에서 적용 할 때는주의하십시오.
lm
). 우리는 모두 Tuebingen 데이터 세트 관측 샘플을 사용하여 인과 적 발견에 대한 아이디어를 얻을 수있는 것은 아닙니다! :)
변수들 간의 인과 관계는 또한 방향성 아실 그래프 로 표현 될 수 있는데, 이는 방향 이 매우 다르지만 루빈 모델과 수학적으로 동등한 것으로 판명되었습니다 (Wasserman, 2004, 섹션 17.8).
Wasserman, L. (2004). 모든 통계 : 통계적 추론의 간결한 과정 . 뉴욕, 뉴욕 : 스프링거. ISBN 978-0-387-40272-7.