상관 관계가 인과 관계를 의미하지 않습니까?


73

상관 관계가 인과 관계를 의미하지는 않지만 상관 관계가 없으면 인과 관계가 없음을 의미합니까?


46
앤드류 겔먼 (Andrew Gelman)은 "상관은 상관 관계를 암시하지도 않는다"고 말했다.
마이크 헌터

9
아니요. A는 B의 원인 일 수 있지만 비선형으로 만 영향을 미칩니다.
Neil G

3
"상관은 인과 관계와 관련이있다. (그다지 많지 않다.)"
Adrian

7
제발 봐 이 페이지 대우합니다. 인과 관계가 상관 관계를 암시하지 않으면 상관 관계가 인과 관계를 의미하지 않습니다.
EdM

4
상관 관계가 인과 관계를 암시하지 않는다는 사실을 알리는 것이 좋은 출발이지만, 세부 사항을 논의하는 이유는 오래 전부터 단일 상관 ​​관계가 무엇이라고 생각 했습니까? 나는 그것을 공언에 쏟아 부었고, 약간의 노력을 기울인 학생들은 슬로건을 기억하고 생각에 사용할 수 있다는 교사들에게도 매력적이라고 ​​생각했다. 그러나 진실은 통계에서 그다지 인과 관계를 암시하지 않는다는 것입니다. 달리 말하면,이 경고는 종종 상관 관계 장이나 상관 관계 강의에서 나오지만 어디에나 있습니다.
Nick Cox

답변:


76

상관 관계가 없다는 것은 인과 관계가 없음을 의미합니까?

아닙니다. 통제 된 시스템은 그 반대의 예입니다.

인과 관계가 없다면 통제는 분명히 불가능하지만, 성공적인 통제는 대략적으로 말해서 일부 수량이 일정하게 유지된다는 것을 의미합니다.

따라서 이러한 상황에서 상관 관계 부족으로 인과 관계를 맺지 않는 것은 실수입니다.

여기의 다소 국소 예 .


그것에 대해 생각하는 직관적 인 방법
Repmat

+1, 재미있는 테이크. 그러나 모든 종류의 상관 관계 가없는 동안 인과 관계가 존재할 수 있음을 암시하는 것 같습니다 . 사실이 아닙니다. 어떤 사건이 또 다른 사건을 일으키면 어떤 종류의 상관 관계가 존재 합니다. 언급 한 _constant 는 비선형 상관 관계의 형태 일 것입니다
Aksakal

1
브라 VO! 사이드 바에서 질문 제목을 보았을 때 나는 "시스템 관점에서 대답해야합니다." 니가 끝냈어.
Alexis

상관 관계가 없으면 인과 관계를 제거하면 남은 기능은 "인과 관계"라는 레이블을 지정할 수 있습니까?
ttnphns

1
@ttnphns의 질문을 이해하고 있지는 않지만 대답은 다음과 같습니다. 브레이크 케이블을 꽂거나 가속 페달을 분리하면 언덕이 실제로 자동차 속도에 인과 적 영향을 미치기 시작합니다.
conjugateprior

30

주로 상관 관계에 의해 선형 상관 관계를 의미 하기 때문 입니다. 두 변수는 비선형 적 으로 상관 될 수 있으며 선형 상관 관계를 나타내지 않을 수 있습니다 . 그런 예제를 작성하는 것은 쉽지만, (더 좁은) 질문에 더 가까운 예제를 제공합니다.

랜덤 변수 와 랜덤이 아닌 함수 f ( x ) = x 2 를 살펴보고 랜덤 변수 y = f ( x )를 만들어 봅시다 . 후자는 분명히 상관 관계가 아닌 이전 변수 의해 발생 합니다. 산점도를 그리자 :xf(x)=x2y=f(x)

여기에 이미지 설명을 입력하십시오

멋지고 명확한 비선형 상관 관계 그림이지만이 경우 직접적인 인과 관계도 있습니다. 그러나 선형 상관 계수 는 중요하지 않습니다. 즉 명백한 비선형 상관 관계 및 인과 관계에도 불구하고 선형 상관 관계가 없습니다.

>> x=randn(100,1);
>> y=x.^2;
>> scatter(x,y)
>> [rho,pval]=corr(x,y)

rho =

    0.0140


pval =

    0.8904

x

E[x]=0
E[x2]=1
E[xx2]=E[x3]=0
Cov[x,x2]=E[xx2]E[x]E[x2]=0

U[1,1]


8
중요하지 않다는 것이 귀무 가설의 진실을 의미하지는 않습니다. 귀하의 예에서 중요한 것은 모집단 상관 계수가 0이라는 것입니다.
Kodiologist

1
OP가 선형 상관 관계를 의미한다고 생각하는 이유는 무엇입니까?
user253751

원인은 어떤 종류의 비선형 상관 관계가 있어야하기 때문에 @immibis.
Aksakal

E[X3]E[X2]E[X]XE[X3]E[X2]E[X]X

x

18

없음 . 특히, 랜덤 변수는 종속적이지만 상관성이 없습니다.

x[1,1]YxxxYX[1,1]Yx=X(X,Y)XY

P(X<12)P(|Y|<12)=1412=180=P(X<12,|Y|<12).

XY

Corr(X,Y)=Cov(X,Y)σXσY=E[XY]E[X]E[Y]σXσY=000σXσY=0.

1
사실 이것은 제 생각에는 나쁜 예입니다. X는 Y를 유발하지 않습니다. PresenceOfX 모델이없는 이진 변수는 1의 상관 관계를 갖는 실제 원인입니다. 실제로 X 값이 Y에 영향을 미치지 않는다는 것이 증명되었습니다.
user2088176

6
나는 의 선택이 유발하지 않는다고 어떻게 느낄 수 있는지에 대한 손실을보고 있다 . 아마도 "원인"의 의미를 지정해야합니다. xY
Kodiologist

5
@ user2088176 다음은 선택 하면 발생 한다는 간단한 증거입니다 . 가 대한 가능한 분포 세트에 대한 인덱스 인 반 현실적 인과 관계 모델을 사용합시다 . 만약 다음 된다 또는 와 동일 확률. 만약 다음 된다 또는 동등한 확률. 값으로 구별되는 반 사실은 에 대한 뚜렷한 분포를 의미 하므로 , 선택 하면 원인이됩니다.xYxYx=12Y1212x=34Y3434xYxY .
Kodiologist

1
이 예는 를 제한하면 더 간단하고 여전히 작동 합니다. x[0,1]
JiK

3
간단하고 표준적인 예는 어떻습니까 : 및 . 상관 관계는 없지만 분포 는 완벽하게 의존합니다 . XN(0,1)X2χ2(1)X2X
Therkel

14

아마도 계산적 관점에서 보면 도움이 될 것입니다.

구체적인 예로서 의사 난수 생성기를 사용하십시오.

설정 한 시드와 생성기 의 출력 사이에 인과 관계가 있습니까?kth

측정 가능한 상관 관계가 있습니까?


7

질문에 대한 더 나은 대답은 상관 관계가 통계적, 수학적 및 / 또는 물리적 관계이고 인과 관계는 형이상학 적 관계라는 것입니다. 형이상학을 물리학에 구속하는 (대형) 가정이 없으면 상관 (또는 비 상관)에서 인과 관계로 논리적으로 얻을 수 없습니다. (한 예는 두 사람이 "합리적 관찰자"로 동의 할 수있는 것은 상당히 임의적이고 아마도 모호한 것입니다). A가 C를 수행하기 위해 B에게 지불하여 D를 발생시키는 경우 D의 원인은 무엇입니까? C 또는 B 또는 A (또는 A의 선구자 이벤트)를 선택해야 할 합리적인 이유는 없습니다. 통제 이론은 통제되는 영역의 시스템을 다룬다. 제어하에 종속 변수를 얻는 한 가지 방법은 통계 변수에 대한 독립 변수의 (제어 된) 변동 범위에 대한 변수의 응답을 줄이는 것입니다. 예를 들어, 우리는 기압이 건강과 관련이 있다는 것을 알고 있지만 (진공 호흡을 시도하십시오) 기압을 1 +/- 0.001 atm으로 조절하면 공기 압력의 변화가 건강에 영향을 줄 가능성은 얼마나됩니까?


당신이 겪고있는 차이는 '샘플에서 관찰'(상관) 대 샘플에서 관찰되는지 (물리) 여부에 따라 달라지는 종속성입니다. 이 설명에서는 형이상학에 대한 역할이 없습니다 (물리적 가정에 대해서는 일부). 스프링은 스프링에 도달했는지 여부에 따라 탄성 한계가 있습니다. 또는 좀 더 가정적인 예 : 설탕 큐브는 녹을 있습니다. 차에 떨어 뜨릴 경우 녹는다는 것을 암시하는 명백한 인과 개념 입니다. 그러나이 인과 관계는 순전히 물리적 구조 때문입니다. 설탕 큐브를 녹일 생각이 없어도 설탕 큐브는 녹을 수 있습니다.
junctionprior

1
물론 인과 관계에 대한 가정이 없으면 인과적인 결론을 얻지 못한다는 것이 옳습니다. 그러나 실제로 그것에 대해 형이상학적인 것은 없습니다!
켤레 이전

인과성 이론 (예 : 진주 또는 우드워드)이 "A가 B에게 C를 지불하기 위해 B를 지불하면 D의 원인은 무엇입니까? C 또는 B 또는 A를 선택해야 할 합리적인 이유는 없습니다"라는 의미를 정확히 이해하도록 설계되었습니다. . 이 이론들이 안고있는 유일한 구식 개념과 도움이되지 않는 개념은 우리 가 무언가 원인이 있다는 생각을 항상 알 수 있다는 것입니다. 물론 없습니다.
켤레 이전

5

, 이전 답변과 달리 저는 비 기술적, 특히 "상관"의 정의로 질문을 할 것입니다. 어쩌면 내가 너무 광범위하게 사용하고 있지만 두 번째 글 머리 기호를 참조하십시오. 다른 답변이 질문의 다른 부분을 밝히기 때문에 여기에서 다른 답변에 대해 논의하는 것이 적절하다고 생각합니다. 나는 인과 관계에 대한 Pearl의 접근 방식을 그리고 특히 Kevin Korb의 논문에서이를 취하고 있습니다. Woodward는 아마도 가장 명확한 비 기술적 계정을 가지고있을 것입니다.

  • @conjugateprior는 "제어 시스템은 그 반대의 예"라고 말합니다. 예, 실험 에서 관찰 된 비 상관은 원인이 없음을 암시합니다. 질문이 더 일반적이라고 가정하겠습니다. 확실히 하나의 실험이 마스킹 원인을 제어하지 못하거나 일반적인 효과를 부적절하게 제어하여 상관 관계를 숨겼을 수 있습니다. 그러나 가 유발하면 그 관계가 드러난 통제 된 실험 이있을 입니다. 인과 관계에 대한 거의 모든 정의 나 설명은이를 차이를 만드는 차이로 취급합니다. 따라서 상관 관계가없는 인과 관계는 없습니다. 인과 적 베이지안 네트워크에 직접 링크 가 있다고해서xyxyx 항상에 차이가 있습니다 거기에만 있다는 일부 의 모든 다른 원인 고정 실험 방도를 강구 흔들의 .yyxy

  • @aksakal은 선형 인과 관계가 불충분 한 이유를 잘 보여 줍니다. 동의하지만, 넓고 비 기술적 인 사람이되고 싶습니다. 만약 , 그것은 클라이언트 말해 불완전 와 상관입니다 . 따라서 상관 관계를 매우 광범위하게 사용 하여 의 차이와 확실하게 관련된 의 차이를 의미합니다 . 원하는대로 비선형 또는 비모수적일 수 있습니다. 임계 값 효과는 양호합니다 ( 는 와 차이가 있지만 유한 범위에서만, 또는 디지털 회로의 전압과 같이 특정 값보다 크거나 작음).y=x2yxxyxy

  • @Kodiologist는 인 예제를 작성 하므로선형 상관 관계는 없습니다. 그러나 명백한 발견 가능한 관계가 있으므로 넓은 의미에서 상관됩니다.| y | = | x |y=Unif(x,x)|y|=|x|

  • @Szabolcs는 난수 생성기를 사용하여 상관되지 않은 것으로 구성된 출력 스트림을 표시합니다. 의 숫자와 같이 스트림은 무작위로 나타나지만 결정적입니다. 데이터 만 제공하면 관계 를 찾을 가능성이 없지만 동의합니다 .π

  • @Li Zhi는 논리적으로 상관 관계에서 인과 관계로 이동할 수 없다고 지적합니다. 예, 원인이 없습니다. 원인이 없습니다. 그러나 문제는 인과 관계에서 시작됩니다. 상관 관계를 암시합니까? 공기압 예제에서는 임계 값 효과가 있습니다. 기압이 건강과 관련이없는 범위가 있습니다. 실제로 건강에 인과 적 영향이없는 곳에서 그럴듯하게. 그러나 범위가 있습니다. 충분합니다. 그러나 효과가 있거나없는 범위를 주목하는 것이 좋습니다. 경우 원인이 있기 때문에, 다음의 상관 관계가 모두 사슬있다. 반복 관찰 (또는 실험)은 가 직접 유발 하지 않는다는 것을 보여줄 있습니다.A DABCDAD 그러나 인과 관계가 있기 때문에 상관 관계가 있습니다.

@ user2088176이 무엇을 염두에 두 었는지 모르겠지만 질문을 매우 일반적으로 받아들이면 대답은 그렇습니다. 적어도 나는 그것이 인과 발견 문헌과 인과에 대한 중재 론적 설명에 필요한 답이라고 생각합니다. 원인은 차이를 만드는 차이점입니다. 그리고 그 차이는 일부 실험에서 지속적인 연관성으로 밝혀 질 것입니다.


1
나는 당신이 가지고있는 것처럼 더 간단한 관점과 비 기술적 인 관점에서 이것에 접근하기를 바랐습니다. "원인"이란 무엇입니까? 아마도 그것은 다른 것에 변화를 가져 오는 무언가의 변화와 관련이있을 것입니다. 상관 관계가 없으면 인과 관계를 추측 할 수 없습니다.
Behacad

1
@ Behacad 나는 대조가 일종의 상관 관계 (관찰 할 수있는 것)와 어떤 종류의 의존성 (발동되지 않을 수도 있음) 사이에 있다고 생각합니다. 트리거되지 않은 종속성이 있지만 관찰되지 않은 상관 관계는 없습니다. 그렇기 때문에 인과 관계는 그 정의와 반대되는 요소를 가지지 만 상관 관계는 그렇지 않습니다.
conjugateprior
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.