3x3 상관 행렬 완성하기 : 주어진 3 개의 계수 2 개


20

나는 인터뷰에서이 질문을 받았다.

[ 1 0.6 0.8 0.6 1 γ 0.8 γ 1 ] 형식의 상관 행렬이 있다고 가정하겠습니다 .

[10.60.80.61γ0.8γ1]

이 상관 관계 매트릭스를 감안할 때 감마 값을 찾아야했습니다.
고유 값으로 모두 0 이상이어야하기 때문에 무언가를 할 수 있다고 생각했습니다 (매트릭스는 양의 반올림해야합니다). 트릭이 없습니다.

동일한 문제를 해결하기위한 힌트를 제공해 주시겠습니까?


의견은 긴 토론을위한 것이 아닙니다. 이 대화는 채팅 으로 이동 되었습니다 .
whuber

1
이 사이트를 검색하면 stats.stackexchange.com/questions/5747 과 같은 관련 수식이 포함 된 (다수의) 스레드 중 하나로 직접 연결되었습니다 . felix s의 답변에 유용한 플롯이 있습니다 .
whuber

답변:


21

우리는 이미 [ 1 , 1γ 의 상관 관계 행렬이 semidefinite 긍정적이어야하며, 따라서 그것의 주요한 미성년자가 음수가 아닌 수 있어야[1,1]

따라서,

1(1γ2)0.6(0.60.8γ)+0.8(0.6γ0.8)0γ2+0.96γ0γ(γ0.96)0 and 1γ10γ0.96

4
@novice 당신은 실베스터의 기준
권리

좋은 대답입니다. 감마를 얻는 일반적인 방법은 위의 방정식을 풀면서 가능한 가장 작은 핵 규범 (일명 ky-fan 규범)의 상관 행렬로 이어지는 감마를 찾는 것입니다. 자세한 내용은 "매트릭스 완료", "압축 감지"를 참조하거나 bit.ly/2iwY1nW 주제에서이 보고서를 확인하십시오 .
Mustafa S Eisa

1
이를 증명하기 위해서는 다른 방향의 결과가 필요합니다. 모든 사소한 선행 마이너가 이고 행렬이 0 이면 행렬은 양의 반정의입니다. >00
Federico Poloni 2012 년

10

다음은 더 단순하고 직관적 인 솔루션입니다.

공분산을 추상 벡터 공간에 대한 내부 곱으로 생각하십시오 . 이어서, 상관 행렬의 엔트리는 벡터를위한이 v에 1 , V 2 , V 3 각도 브래킷, V , 브이 j는 나타내고 각도 사이의 V IV의 J를 .cosvi,vjv1v2v3vi,vjvivj

것을 시각화하는 것은 어렵지 않아 에 의해 제한되어 | V 1 , V 2± V 1 , V 3| . ITS의 코사인에 바인딩 ( γ는 )이고 따라서 왜냐하면 [V 1 , V 2± V 1 , V 3] . 그런 다음 기본 삼각법으로 γ [ 0.6v2,v3|v1,v2±v1,v3|γcos[v1,v2±v1,v3] .γ[0.6×0.80.6×0.8,0.6×0.8+0.6×0.8]=[0,0.96]

편집 : 참고하는 것이 마지막 행의는 정말 왜냐하면 V 1 , V 2왜냐하면 V 1 , V 3V 1 , V 3V 1 , V 2 -0.6과 0.8의 두 번째 출현은 0.6 2 + 0.8 2 = 1로 인해 우연히 발생합니다.0.6×0.80.6×0.8cosv1,v2cosv1,v3sinv1,v3sinv1,v20.62+0.82=1.


1
+1, 합법적 인 기하학적 추론 (그렇지만 계산은 확인하지 않았습니다). 이것은 내가 질문에 대한 의견에서 제안한 것과 정확히 같습니다 (불행히도 모든 의견은 중재자가 채팅으로 이동했습니다 (위 링크 참조).
ttnphns 2012 년

모든 상관 관계가 음이 아니어야한다는 것이 "증명 된"것 같습니다. 왜냐하면 하한에 대해 계산에서 항상 0을 제공 하기 때문 입니다. 그렇지 않은 경우 계산의 일반적인 작동 방식을 자세히 설명 할 수 있습니까? 이해가 안 아마도 나 - - 나는 정말로 신뢰를 할 세 개 이상의 차원에서 당신은 항상 찾을 수 있기 때문에, 당신의 바인딩 하는 모두 V 1V 2 = V 1V 3 = 0 다음 바운드는 v 2v 3 이 항상 0 임을 의미 합니다! (cc @ttnphns)v1v1v2=v1v3=0v2v3
우버

@ whuber : 혼란에 대해 죄송합니다. 하한값을 계산할 때 항상 0이되는 것은 아닙니다 . 내 답변을 수정했습니다.
yangle

나의 마지막 우려에 어떻게 대응합니까? 경계가 잘못되었음을 나타냅니다.
whuber

@whuber : 귀하의 경우에는 ⟨v1, v2⟩ = ⟨v1, v3⟩ = π / 2이므로 바운드 | ⟨v1, v2⟩ ± ⟨v1, v3⟩ | 예상대로 [0, π]입니다. γ에 결합 된 cos⟨v1, v2⟩cos⟨v1, v3⟩∓sin⟨v1, v3⟩sin⟨v1, v2 also도 [-1, 1]로 나타납니다.
yangle

4

여기에 답에 대한 초기 의견에서 @yangle이 말할 수있는 것으로 생각한 것이 있습니다 (계산을 따르거나 확인하지는 않았지만).

"매트릭스는 양의 반올림이어야합니다" 는 변수 벡터가 유클리드 공간에 묶여 있음을 의미 합니다. 3 개의 벡터 길이가 1로 고정되어 있기 때문에 상관 행렬의 경우 공분산 행렬보다 쉽습니다. 3 개의 단위 벡터 XYZ를 상상하고 각도코사인 임을 기억하십시오 . 따라서 cos α = r x y = 0.6 이고 cos β = r y z = 0.8 입니다. cos 의 경계는 무엇입니까? γ = r x zrcosα=rxy=0.6cosβ=ryz=0.8cosγ=rxz? 이 상관 관계는 Z에 대해 Z를 둘러싸고 정의한 값을 가질 수 있습니다 (유지 각도 ).ryz=0.8

enter image description here

그것이 회전함에 따라, 두 위치는 Z가 평면 XY로 떨어질 때 궁극적 인 wrt X로서 현저하다. 하나는 X와 Y 사이에 있고 다른 하나는 Y의 반대편에 있습니다. 이들은 파란색과 빨간색 벡터로 표시됩니다. 이 두 위치에서 XYZ 구성 (상관 행렬)은 단수입니다. 그리고 이것들은 최소 및 최대 각도 (따라서 상관 관계) Z는 wrt X를 얻을 수 있습니다.

평면에서 각도의 합 또는 차이를 계산하기 위해 삼각법을 선택하면 다음과 같은 이점 이 있습니다.

cosγ=rxyryz(1rxy2)(1ryz2)=[0,0.96]

이 기하학적 관점은 @rightskewed가 대수적 용어 (사소한 것 등)로 표현 된 것에 대한 또 하나의 (그리고 3D 경우의 구체적이고 간단한) 모습입니다.


If X,Y,Z are random variables, how do you map them to vectors in 3d space (They can only be vectors in 1d space). Also if the RV's are Nx1, then they will be vectors in N dimensional space?
novice

@novice Yes, they are initially 3 vectors in Nd space, but only 3 dimensions are nonredundant. Please follow the 2nd link in the answer and read further reference there to subject space where it is explained.
ttnphns

4

Playing around with principal minors may be fine on 3 by 3 or maybe 4 by 4 problems, but runs out of gas and numerical stability in higher dimensions.

이와 같은 단일 "자유"매개 변수 문제의 경우 행렬 psd를 만드는 모든 값 집합이 단일 간격임을 쉽게 알 수 있습니다. 따라서 최소값과 최대 값을 찾는 것으로 충분합니다. 이는 한 쌍의 선형 반 고정 프로그래밍 (SDP) 문제를 수치 적으로 해결하여 쉽게 달성 할 수 있습니다.

  1. 매트릭스에 따라 γ를 최소화하는 것은 psd이다.
  2. 매트릭스에 따라 γ를 최대화하는 것은 psd이다.

예를 들어, MATLAB에서 YALMIP를 사용하여 이러한 문제를 공식화하고 수치 적으로 해결할 수 있습니다.

  1. 감마 = sdpvar; A = [1.6 .8; .6 1 감마; .8 감마 1]; 최적화 (A> = 0, 감마)
  2. 최적화 (A> = 0, 감마)

빠르고 쉽고 안정적입니다.

BTW, if the smarty pants interviewer asking the question doesn't know that SemiDefinite Programming, which is well-developed and has sophisticated and easy to use numerical optimizers for reliably solving practical problems, can be used to solve this problem, and many much more difficult variants, tell him/her that this is no longer 1870, and it's time to take advantage of modern computational developments.


4

Let us consider the following convex set

{(x,y,z)R3:[1xyx1zyz1]O3}

which is a spectrahedron named 3-dimensional elliptope. Here's a depiction of this elliptope

enter image description here

Intersecting this elliptope with the planes defined by x=0.6 and by y=0.8, we obtain a line segment whose endpoints are colored in yellow

enter image description here

The boundary of the elliptope is a cubic surface defined by

det[1xyx1zyz1]=1+2xyzx2y2z2=0

If x=0.6 and y=0.8, then the cubic equation above boils down to the quadratic equation

0.96zz2=z(0.96z)=0

Thus, the intersection of the elliptope with the two planes is the line segment parametrized by

{(0.6,0.8,t)0t0.96}

1

Every positive semi-definite matrix is a correlation/covariance matrix (and vice versa).

To see this, start with a positive semi-definite matrix A and take its eigen-decomposition (which exists by the spectral theorm, since A is symmetric) A=UDUT where U is a matrix of orthonormal eigenvectors and D is a diagonal matrix with eigen values on the diagonal. Then, let B=UD1/2UT where D1/2 is a diagonal matrix with the square root of eignevalues on the diagonal.

Then, take a vector with i.i.d. mean zero and variance 1 entries, x and note that Bx also has mean zero, and covariance (and correlation) matrix A.

Now, to see every correlation/covariance matrix is positive semi-definite is simple: Let R=E[xxT] be a correlation matrix. Then, R=RT is easy to see, and aTRa=E[(aTx)2]0 so the Rayleigh quotient is non-negative for any non-zero a so R is positive semi-definite.

Now, noting that a symmetric matrix is positive semi-definite if and only if its eigenvalues are non-negative, we see that your original approach would work: calculate the characteristic polynomial, look at its roots to see if they are non-negative. Note that testing for positive definiteness is easy with Sylvester's Criterion (as mentioned in another answer's comment; a matrix is positive definite if and only if the principal minors all have positive determinant); there are extensions for semidefinite (all minors have non-negative determinant), but you have to check 2n minors in this case, versus just n for positive definite.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.