A와 B가 C와 상관 관계가있는 경우 왜 A와 B가 반드시 상관 관계는 없습니까?


62

나는 그것이 경험적으로 알고 있습니다. 나는이 수수께끼에 빠지는 모델을 방금 개발했습니다. 또한 반드시 예 / 아니오라고 생각하지는 않습니다. A와 B가 모두 C와 상관되어 있으면 A와 B의 상관 관계에 영향을 줄 수 있지만이 의미는 약할 수 있습니다. 그것은 단지 부호 방향 일 수도 있고 다른 것도 아닐 수도 있습니다.

이것이 의미하는 바입니다. A와 B는 모두 C와 0.5의 상관 관계를가집니다. A와 B의 상관 관계는 1.0 일 수 있습니다. 나는 또한 0.5 또는 그보다 낮을 수 있다고 생각합니다. 그러나 나는 그것이 부정적 일 것 같지 않다고 생각합니다. 당신은 그것에 동의합니까?

또한 표준 Pearson 상관 계수 또는 Spearman (순위) 상관 계수를 고려할 경우 영향이 있습니까? 최근의 경험적 관찰은 Spearman Correlation Coefficient와 관련이 있습니다.


38
예를 들어 , 및 있습니다. 우리가 취할 수있는 및 독립적으로, 아직 모두 와 함께 (양, 피어슨) 상관 . B = Y C = X + Y X Y A B CA=XB=YC=X+YXYABC

1
고마워, 그것은 실제로 좋은 의견입니다. 짧지 만, 그 이유의 본질을 포착합니다.
Sympa

답변:


53

상관 관계는 다변량 분포의 수학적 특성이므로 분포의 통계적 생성에 관계없이 계산을 통해 일부 통찰력을 얻을 수 있습니다.

위해 피어슨 상관 관계를 고려 multinormal 변수 , , . 음이 아닌 한정 행렬이 실제로 일부 다중 정규 분포의 공분산 행렬이므로 존재하는 문제를 해결하기 때문에 이것으로 작업하는 데 유용합니다. 대각선 이 행렬을 고수하는 경우 공분산 행렬의 대각선을 벗어난 항목은 상관 관계가됩니다. 필기구의 상관 및 와 같은 의 관계의 및 등 와의 상관 및 등을Y Z 1 X Y ρ Y Z τ X Z σXYZ1XYρYZτXZσ , 우리는

  • 1+2ρστ(ρ2+σ2+τ2)0 (상관 행렬의 결정 요소이므로 음수가 될 수 없으므로).

  • 경우 이 있음을 의미 . 다시 말해, 와 가 모두 크면 와 는 0이 아닌 상관 관계 가져야 합니다 .ρ 2 + τ 21 ρ τ X Zσ=0ρ2+τ21ρτXZ

  • 만약 , 다음의 비 - 음의 값 (사이에 과 과정)이 가능하다.σ 0 1ρ2=τ2=1/2σ01

  • 경우 , 음의 값 허용된다. 예를 들어, 경우 는 와 사이에있을 수 있습니다 .σ ρ = τ = 1 / 2 σ - 1 / 2 1ρ2+τ2<1σρ=τ=1/2σ1/21

이러한 고려 사항은 실제로 상호 상관 관계에 일부 제약이 있음을 의미합니다. 단 변량 분포에 대한 가정에 따라 제약 조건 (변수의 실제 분포가 아닌 음수가 아닌 상관성에만 의존 함)을 강화할 수 있습니다. 예를 들어, 그것의 분포 상태를 볼 수 있도록 (및 증명) 것을 쉽게 와 같은 위치 규모의 가족에없는, 자신의 상관 관계가 있어야합니다 엄격 보다 작 의 크기를. (증명 : 의 상관 관계는 와 가 다음과 선형 적으로 관련 됨을 의미합니다 )Y 1 ± 1 X YXY1±1XY

지금까지로 스피어 만 순위 상관 관계가 가고, 세 trivariate 관찰 고려 , 과 의 . 상호 순위 상관 관계는 , 및 입니다. 따라서 와 의 순위 상관의 부호조차도 와 와 와 의 상관 관계의 부호와 반대 일 수 있습니다 .( 2 , 3 , 1 ) ( 3 , 2 , 3 )(1,1,2)(2,3,1)(3,2,3)1 / 2 1 / 2 - 1 / 2 Y Z X Y X Z(X,Y,Z)1/21/21/2YZXYXZ


whuber, "다중 정규 변수"란 무엇입니까?
Sympa


평소와 같이 가장 철저한 설명을 통해 "최고의 답변"확인 표시를받을 수 있습니다.
Sympa

@Gaetan Lion 당신은 매우 친절합니다. 나는 이 질문에 대한 모든 답을 읽는 것을 즐겼습니다 (그리고 모두 표시했습니다).
whuber

88

지금은 매년 낚시 여행을하고 있습니다. 내가 낚시하는 시간과 내가 잡는 물고기의 양 사이에는 상관 관계가 있습니다. 내가 사용하는 미끼의 크기와 내가 잡는 물고기의 양 사이에는 상관 관계가 있습니다. 미끼의 크기와 시간 사이에는 상관 관계가 없습니다.


바질, 나는 그것을 좋아한다! 일반 영어 설명은 +1입니다.
Sympa

베스트. 대답. stats.stackexchange에서. Ever
Chris Beeley

1
상관 관계가 낮은 경우부터 설명하지만 상관 관계가 높은 경우에는 설명하지 않습니다. 시간과 80 %의 상관 관계가 있고 미끼의 크기와 80 %의 상관 관계가 있으면 낮 동안 더 큰 미끼를 사용하고 있음을 보장 할 수 있습니다!
user35581

2
@ user35581 아니요. 요점을 놓쳤습니다. 매 시간마다 작은 미끼로 한 번, 큰 미끼로 한 번 낚시 할 수있었습니다. 그는 여전히 하루 중 특정 부분 (80 % 상관) 동안 더 많은 물고기를 잡을 수 있고 더 큰 미끼 (80 % 상관)로 더 많은 물고기를 잡을 수 있으며 그가 사용하는 미끼의 크기와 시간 사이에는 0의 상관 관계가 있습니다. 하루 중 불량 시간을 보상하기 위해 피크가 아닌 시간대에 더 큰 미끼를 더 자주 사용하면 부정적인 상관 관계가 될 수도 있습니다. 따라서 당신은 하루 중 시간과 미끼의 크기 사이의 상관 관계에 대해 전혀 알지 못합니다.
rysqui

2
@rysqui 죄송합니다. 내 의견이 잘못 표현되었지만 내가 만들려고했던 것은 이것입니다. 기능과 대상 간의 상관 관계가 매우 높아지면 기능도 상호 관련되어야합니다. 따라서 시간과 포획 크기 사이에 완벽한 상관 관계가 있고 미끼 크기와 캐치 크기 사이에 완벽한 상관 관계가있는 경우 미끼 크기와 시간 사이에 완벽한 상관 관계가 있어야하므로 최종 진술 "낮에는 더 큰 미끼를 사용하고 있습니다". 이것이 엣지 케이스라는 것을 명심하십시오!
user35581

20

상관은 두 벡터 사이의 각도의 코사인입니다. 설명 된 상황에서 (A, B, C)는 n 번 이루어진 3 번의 관측 값으로, 각 관측 값은 실수입니다. A와 B 사이의 상관 관계 는 n 차원 유클리드 공간에서 측정 된 와 사이의 각도의 코사인입니다 . 따라서 우리의 상황은 n 차원 공간에서 3 개의 벡터 , 및 를 고려하는 것으로 줄어 듭니다 . 우리는 3 쌍의 벡터와 3 개의 각도를 가지고 있습니다. 두 개의 각도가 작 으면 (상관도가 높은) 세 번째 각도도 작습니다. 그러나 "상관 된"이라는 말은 제한이 많지 않습니다. 각도가 0에서 사이임을 의미합니다.V B = B E ( B ) V A V B V C π / 2 π V A V B V C V A V BVA=AE(A)VB=BE(B)VAVBVCπ/2. 일반적으로 이것은 세 번째 각도에 전혀 제한을 두지 않습니다. 다시 와 사이의 각도가 보다 작은 각도에서 시작합니다 (-1을 제외한 상관 관계). 하자 사이의 각도 양분 및 . 그러면 C는 A와 B와 상관됩니다.πVAVBVCVAVB


다차원 벡터 사이의 각도 측면에서 +1 상관 관계는 직관적입니다.
Petrus Theron

2
장래 독자들을 위해 다음 스레드에서이 기하학적 답변 (그림과 함께!)을 확장합니다 : talkstats.com/showthread.php/…
Jake Westfall

18

whuber의 답변에 대한 추가 기능으로 : 제시된 공식

1+2ρστ(ρ2+σ2+τ2)0 .

다음과 같은 불평등으로 변형 될 수있다 (Olkin, 1981) :

στ(1σ2)(1τ2)ρστ+(1σ2)(1τ2)

대한 상한 및 하한 의 그래픽 표현 은 다음과 같습니다.ρ

여기에 이미지 설명을 입력하십시오


Olkin, I. (1981). 곱-모멘트 상관 행렬에 대한 범위 제한. Psychometrika, 46, 469-472. doi : 10.1007 / BF02293804


이 예제 중 일부가 특정 한계 분포를 갖는 다변량 분포인지 여부를 알려줄 수 있습니까? 그것은 상관 관계가 -1에서 1까지의 전체 범위를 취할 수 없다는 것을 의미합니다. 저는 Frechet이 1950 년대에 이것을 개발 한 사람 중 적어도 한 사람인 것을 기억합니다. 오늘 문헌을 검색 할 때 현재는 Frechet copulas라고합니다.
Michael Chernick

14

"왜 서로 상관해야합니까?"라고 물어 보는 것이 좋습니다. 또는, "왜 특별한 상관 관계가 있어야합니까?"

다음 R 코드는 x1과 x2가 Y와 상관 관계가 있지만 서로 상관 관계가 0 인 경우를 보여줍니다.

x1 <- rnorm(100)
x2  <- rnorm(100)
y <- 3*x1 + 2*x2 + rnorm(100, 0, .3)

cor(x1,y)
cor(x2,y)
cor(x1,x2)

Y와의 상관 관계는 .3을 .1로 줄이거 나


불행히도, 나는 R 사용자가 아닙니다. 따라서 위의 코드는 귀하에게 의미하는 것보다 나에게 의미가 없습니다.
Sympa

2
@Gaetan Lion :이 코드에서 및 는 독립적 인 루트 법선이며 에 표준 편차가 0.3 인 표준 노이즈 항을 더한 값입니다. 분명히 는 및 와 양의 상관 관계가 있으며 이는 독립적입니다. x1x2y=3x1+2x2yx 2x1x2
shabbychef

14

나는 통계적 데모를 나보다 더 적합한 사람들에게 맡길 것이다. 그러나 직관적으로 이벤트 A는 이벤트 C의 생성에 기여하는 프로세스 X를 생성한다고 말한다. 그러면 A는 C를 통해 (X를 통해) 상관된다. 반면에 B는 Y를 생성하여 C를 형성합니다. 따라서 A는 C와 상관되며 B는 C와 상관되지만 A와 B는 상관되지 않습니다.


1
@좋은. 마지막 문장의 마지막 부분에서 "A와 B 는 서로 관련이 없습니다 "를 의미한다고 생각합니다 .
suncoolsu

예, 선 쿨수 보정 기능이있는 Nico ... 이것은 상당히 좋은 설명입니다. 경로 분석을 부분적으로 설명하고 있습니다.
Sympa

그렇습니다, 죄송합니다, 나는 편지와 섞여 있었다;)
nico

1

직관을 원하는 사람들에게는 상관 관계가 어떤 각도의 코사인으로 보일 수 있습니다. 따라서 3D로 된 3 개의 벡터 (A, B, C)가 각각 하나의 변수에 해당한다고 가정 해 봅시다. 문제는 A와 B 사이의 각도와 B et C 사이의 각도가 알려진 경우 A와 C 사이의 가능한 각도 범위를 결정하는 것입니다. 이를 위해 소프트웨어를 설치하지 않고도 온라인 도구를 사용할 수 있습니다. http://www.montefiore.ulg.ac.be/~pierard/chained_correlations.php 페이지로 이동하십시오 .


0

하나의 예를 보자.

A={x1,x2,x3,x4,x5,x6,x7,x8,x9}

B={x1,x2,x3,0,0,0,0,0,0}

C={0,0,0,x4,x5,x6,0,0,0}

일부 x의 경우 A와 B는 유의 한 상관 관계를 가지며, 유사하게 A와 C도 유의 한 상관 관계를 갖지만 B와 C의 상관 관계는 유의하지 않습니다.

따라서 A와 B가 서로 연관되어 있고 A와 C가 서로 연관되어 있다면 B와 C도 서로 연관되어 있다는 것이 반드시 사실은 아닙니다.

참고 : 이해를 돕기 위해이 예를 큰 데이터로 생각해보십시오.


이러한 주장은 일반적으로 정확하지 않습니다. 와 수 강하게 의 값에 따라, 상관 내지 . 에서 까지 의 값에 따라 는 또는 와 상관 관계가있을 수도 있고 그렇지 않을 수도 있습니다 . "심층적 인 이해"를 위해 계산을 고려하십시오! C x 1 x 6 A B C x 1 x 9BCx1x6ABCx1x9
whuber

나는 Abhishek Anand 답변에 편안합니다. 결국 모든 것이 다른 모든 것과 어느 정도 상관되어 있기 때문입니다. 저는 통계적 중요성 측면에서 벤치마킹하는 방식이 마음에 듭니다. 일단이 프레임 워크를 사용하면 A와 B가 통계적으로 C와 상관 관계가있는 경우 A 나 B가 통계적으로 유의하게 상관 관계가있는 것은 아닙니다 (원래 질문의 실제 프레임 워크 사용). 벤트 다이어그램이 그 개념에 대한 훌륭한 시각적 설명을 만들 수 있다고 생각합니다.
Sympa

@ whuber 동의합니다.
Abhishek Anand

괜찮습니다.하지만이 벡터들 사이의 상관 관계에 대해 오해가있는 것 같습니다. 아무도 당신이이 벡터의 상관 계수에 대해 문의는 일반적으로 정확하지 않습니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.