3 개의 벡터가 모두 음의 쌍별 상관 관계를 가질 수 있습니까?


16

세 개의 벡터 , bc 가 주어지면 ab , a , c , bc 사이 상관 관계 가 모두 음수 일 수 있습니까? 즉, 이것이 가능합니까?abcabacbc

corr(a,b)<0corr(a,c)<0corr(b,c)<0

3
음의 상관 관계는 기하학적으로 중심 벡터가 서로 둔각을 이루는 것을 의미합니다. 이 속성을 가진 평면에 세 개의 벡터 구성을 그리는 데 아무런 문제가 없습니다.
whuber

(그들은 완전히 음의 상관 관계를 할 수없는 다시 다른 상관 관계가 설정 한 범위, 부정적인 상관 관계가있을 수있다), 그러나 일반적으로. ρ=1
karakfa

2
@whuber 귀하의 의견은 Heikki Pulkkinen의 답변과 모순되는 것 같습니다. 비행기의 벡터에서는 불가능하다고 주장합니다. 당신이 그것에 견딜 경우, 당신은 당신의 의견을 답변으로 바꿔야합니다.
RM

2
@RM whuber와 Heikki 사이에는 모순이 없습니다. 이 질문은 n × 3 크기 의 데이터 행렬 에 대해 묻습니다 . 일반적으로 우리는 3 차원에서 n 개의 데이터 포인트에 대해 이야기 하지만,이 Q는 n 차원 에서 3 개의 "벡터"에 대해 이야기하고 있습니다. Heikki는 n = 2 인 경우 모든 음의 상관 관계가 발생할 수 없다고 말합니다 (실제로 센터링 후 두 점은 완벽하게 상관 관계가 있으므로 상관 관계는 ± 1 이어야 하고 모두 -1 수는 없습니다 ). Whuber는 n 차원의 3 개 벡터 가 2 차원 부분 공간 (즉, X)에 효과적으로 위치 할 수 있다고 말한다.Xn×3nnn=2±11nX순위 2)이며 메르세데스 로고를 상상해보십시오.
amoeba는 Reinstate Monica

답변:


19

벡터의 크기가 3 이상이면 가능합니다. 예를 들어

a=(1,1,1)b=(1,9,3)c=(2,3,1)

상관 관계는

cor(a,b)=0.80...cor(a,c)=0.27...cor(b,c)=0.34...

크기가 2 인 벡터의 경우 이것이 불가능하다는 것을 증명할 수 있습니다 :

cor(a,b)<02(iaibi)(iai)(ibi)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)a1b1+a1b2+a2b1+a2b2<0a1b1+a2b2a1b2+a2b1<0a1(b1b2)+a2(b2b1)<0(a1a2)(b1b2)<0

The formula makes sense: if a1 is larger than a2, b1 has to be larger than b1 to make the correlation negative.

Similarly for correlations between (a,c) and (b,c) we get

(a1a2)(c1c2)<0(b1b2)(c1c2)<0

Clearly, all of these three formulas can not hold in the same time.


3
Another example of something unexpected that only happens in dimension three or higher.
nth

1
With vectors of size 2, correlations are usually ±1 (straight line through two points), and you cannot have three correlations of 1 with three vectors of any size
Henry

9

Yes, they can.

Suppose you have a multivariate normal distribution XR3,XN(0,Σ). The only restriction on Σ is that it has to be positive semi-definite.

So take the following example Σ=(10.20.20.210.20.20.21)

Its eigenvalues are all positive (1.2, 1.2, 0.6), and you can create vectors with negative correlation.


7

let's start with a correlation matrix for 3 variables

Σ=(1pqp1rqr1)

non-negative definiteness creates constraints for pairwise correlations p,q,r which can be written as

pqrp2+q2+r212

For example, if p=q=1, the values of r is restricted by 2rr2+1, which forces r=1. On the other hand if p=q=12, r can be within 2±34 range.

Answering the interesting follow up question by @amoeba: "what is the lowest possible correlation that all three pairs can simultaneously have?"

Let p=q=r=x<0, Find the smallest root of 2x33x2+1, which will give you 12. Perhaps not surprising for some.

A stronger argument can be made if one of the correlations, say r=1. From the same equation 2pqp2+q2, we can deduce that p=q. Therefore if two correlations are 1, third one should be 1.



2

A simple R function to explore this:

f <- function(n,trials = 10000){
  count <- 0
  for(i in 1:trials){
    a <- runif(n)
    b <- runif(n)
    c <- runif(n)
    if(cor(a,b) < 0 & cor(a,c) < 0 & cor(b,c) < 0){
      count <- count + 1
    }
  }
  count/trials
}

의 함수는 0 n에서 f(n)시작하여 0이 아닌 n = 3값 (일반 값은 약 0.06)으로 증가한 다음 약 0.11로 증가한 n = 15후 안정화됩니다.

enter image description here 따라서 세 가지 상관 관계를 모두 음수로 만들 수있을뿐만 아니라 (적어도 균일 한 분포의 경우)별로 드문 일은 아닙니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.