상관 행렬의 제로 고유 값에 대한 충분하고 필요한 조건


11

확률 분포가 인 n 랜덤 변수 주어지면 상관 행렬 는 양의 반정의, 즉 고유 값입니다. 양수 또는 0입니다.XiP(X1,,Xn)Cij=E[XiXj]E[Xi]E[Xj]

가 제로 고유 값 을 갖기에 필요하거나 충분한 의 조건에 관심 이 있습니다 . : 예를 들어, 충분 조건은 확률 변수가 독립적이지 점이다 진짜 숫자 . 예를 들어, 다음 되고 고유 값이 0 인 의 고유 벡터 우리가있는 경우 상의 독립적 인 선형 제약을 '이 형이야, 그것은을 암시 제로 고유 값을.PCmiuiXi=0uiP(X1,,Xn)=δ(X1X2)p(X2,,Xn)u=(1,1,0,,0)CmXim

일부 대해 (예 : ) 인 경우 하나 이상의 추가 (그러나 사소한) 가능성 이 있습니다. case 의 열과 행은 0입니다. . 실제로는 흥미롭지 않기 때문에 확률 분포가 그 형태가 아니라고 가정합니다.Xa=E[Xa]aP(X1,,Xn)δ(XaE[Xa])CijCia=Cai=0,i

내 질문은 : 선형 제약 조건이 제로 고유 값을 유도하는 유일한 방법 입니까 ( 위에 주어진 사소한 예외를 금지하는 경우), 무작위 변수에 대한 비선형 제약 조건도 제로 고유 값을 생성 할 수 있습니까?C


1
정의에 따르면, 제로 벡터를 포함하는 벡터 컬렉션은 선형으로 종속되므로 추가 가능성은 새로운 것이거나 다르지 않습니다. 당신은 당신 "은 필요에 의해 무엇을 의미하는지 설명해 주시겠습니까 m 고유 값을"? 그것은 일종의 인쇄상의 오류처럼 보입니다.
whuber

@ whuber : 예, 오타. 수정했습니다. 두 조건이 다르다고 생각합니다. 하나는 변수 간의 관계에 관한 것이고 다른 하나는 변수 만의 확률에 관한 것입니다 (즉, ). p(Xa)=δ(XaE(Xa))
Adam

귀하의 질문의 공식은 혼란 스럽습니다. 그것은 선형 대수의 기본 정리처럼 보이지만 "독립적 인"랜덤 변수에 대한 언급은 그것이 다른 것에 관한 것일 수 있음을 시사합니다. "독립적"을 사용할 때마다 (통계적으로) 독립적 인 랜덤 변수가 아니라 선형 독립성의 의미를 의미한다는 것을 이해하는 것이 옳습니까? "무작위 변수"가 실제로 데이터 행렬의 열을 의미 할 수 있음을 시사하기 때문에 "데이터 누락"에 대한 참조는 더욱 혼란스러워집니다. 이러한 의미를 명확히하는 것이 좋습니다.
whuber

@ whuber : 질문을 편집했습니다. 바라건대 더 명확합니다.
Adam

독립 조건 은 각 X i 의 평균이 0 이 아닌 한 반드시 0 일 필요는 없습니다 . iuiXi=0Xi
Sextus Empiricus

답변:


6

아마도 표기법을 단순화하여 필수 아이디어를 도출 할 수 있습니다. 모든 것이 순전히 대수적이기 때문에 기대치 나 복잡한 수식이 필요하지 않습니다.


수학적 대상의 대수적 성질

문제는 (1) 유한 변수로 구성된 유한 변수의 공분산 행렬 및 (2) 벡터로 간주되는 변수 간의 선형 관계 간의 관계에 관한 것 입니다.X1,,Xn

해당 벡터 공간 (주어진 확률 공간의 모든 유한 분산 랜덤 변수들의 집합이다 는 거의 확실하게 일정한 변수의 부분 공간 모듈로) 표시 L (2) ( Ω , P ) / R을 . (즉, 우리는 두 확률 변수 고려 XY를 동일하게 벡터 것을 제로 기회가있을 때 X - Y의 우리는 유한 차원 벡터 공간으로 다루고있다. 그 기대는 다릅니다)이 V 에 의해 생성 된 X 내가 ,(Ω,P)L2(Ω,P)/R.XYXYVXi, 이것이 분석적인 문제가 아닌 대수 문제를 만드는 것입니다.

분산에 대해 알아야 할 사항

는 단순한 벡터 공간 그 이상입니다. 분산이 장착되어 있기 때문에2 차 모듈입니다. 분산에 대해 알아야 할 것은 두 가지입니다.V

  1. 분산은 스칼라 값 함수이고 라는 속성 Q ( X는 ) = 2 Q ( X가 ) 모든 벡터에 대한 X .QQ(aX)=a2Q(X)X.

  2. 분산은 변질되지 않습니다.

두 번째는 약간의 설명이 필요합니다. 는 "dot product"를 결정하는데, 이는 다음과 같이 대칭적인 이중선 형태입니다.Q

XY=14(Q(X+Y)Q(XY)).

(이것은 변수의 공분산 이외 물론 아무것도 인 Y . 일러스트) XY가 있는 직교 그들의 내적 인 경우 0 직교 보수 벡터의 모든 세트 V는 모든 벡터 구성은 모든 소자에 직교 의 , 작성XY.XY0.AVA,

A0={vVa.v=0 for all vV}.

분명히 벡터 공간입니다. 경우 , Q는 이다 비축.V0={0}Q

분명하게 보일지라도 분산이 실제로 비 변성임을 증명할 수 있습니다. V 0의 0 이 아닌 요소 라고 가정합니다 . 이것은 모든 Y V에 대해 X Y = 0 을 의미합니다 . 동등하게XV0.XY=0YV;

(엑스+와이)=(엑스와이)

모든 벡터 Y = X를 복용 하면Y.Y=X

4Q(X)=Q(2X)=Q(X+X)=Q(XX)=Q(0)=0

따라서 우리는 영 분산 유일한 랜덤 변수의 제로 벡터을 식별에게 거의 확실하게 일정하다는 것을 (아마도, 체비 쇼프 부등식을 사용) 알 그러나 V , QED.Q(X)=0.V,

질문 해석

이전의 표기법에서 질문으로 되돌아 가면 , 랜덤 변수 의 공분산 행렬 은 모든 내적의 일반적인 배열입니다.

T=(XiXj).

에 대해 생각하는 좋은 방법이 있습니다 . 벡터 x = ( x 1 , , x n ) R n 을 벡터 T ( x ) = y 로 보내서 일반적인 방식 으로 R n 에서 선형 변환을 정의합니다. = ( Y 1 , ... , X의 N ) , 그 I 번째 성분 매트릭스 승산 규칙에 의해 주어진다TRnx=(x1,,xn)RnT(x)=y=(y1,,xn)ith

yi=j=1n(XiXj)xj.

이 선형 변환 의 커널 은 그것이 0으로 보내는 부분 공간입니다.

Ker(T)={xRnT(x)=0}.

상기 식은 그 의미 때 각 대 xKer(T),i

0=yi=j=1n(XiXj)xj=Xi(jxjXj).

이 모든 마찬가지이기 때문에 모든 벡터에 의해 스팬 것은 보유 X , 즉 : V 자체. 결과적으로 x Ker ( T ) j x j X j에 의해 주어진 벡터 는 V 0에 있습니다. 분산이 비 변성이기 때문에 이는 j x j X j = 0을 의미 합니다. 즉, xn 개의 원래 랜덤 변수 간의 선형 의존성을 나타냅니다 .i,XiVxKer(T),jxjXjV0.jxjXj=0.xn

이 추론 체인이 뒤집을 수 있는지 쉽게 확인할 수 있습니다.

간에 선형 종속 벡터 그대로 의 커널의 요소와 일대일 대응되어 T .Xj T.

(문이 여전히 고려 기억 위치에서 일정한 시프트까지 정의 - 요소로서 인 L (2) ( Ω , P ) / R . --rather 무작위 변수로서 이하)XjL2(Ω,P)/R

마지막으로 정의함으로써, 고유치 임의의 스칼라 λ 비제 벡터가 존재하는 X를 가진 T ( X ) = λ (X) . 하면 λ = 0 고유치는, 관련된 고유 벡터의 공간 (명백하게)의 커널 T .TλxT(x)=λx.λ=0T.


요약

우리는이 질문에 대한 답변에 도착한 : 랜덤 변수의 선형 종속성들의 세트, ...로서의 원소 일대일들이 공분산 매트릭스의 커널에 대응 T . 이것은 분산이 비 변성 2 차 형태이기 때문입니다. 커널은 또한 고유 값이 0 인 고유 공간입니다 (또는 고유 값이 0이 아닌 경우에만 0의 하위 공간).L2(Ω,P)/R,T.


참고

나는 IV 장의 표기법과 일부 언어를 주로 채택했다.

장 피에르 Serre, 산술 과정. Springer-Verlag 1973.


우와, 대단해! 당신이 "쓸 때 : 그냥 질문은 확실히 내가 다 이해가 되실 벡터 등을"당신이 (즉, 벡터의 확률 변수를 수집하는 의미하지 않는다 X = ( X 1 , ... , X N을 ) ), 또는 당신을 ? 내가 맞다, 난 당신이 확률 변수의 가능한 값을 수집하는 같은데요 X 전을 확률 분포가 분산의 정의에 숨겨져있는 동안 오른쪽, 벡터에? XjX=(X1,,Xn)Xi
Adam

나는 분명하지 않은 주요 측면이 다음과 같다고 생각한다 (확률 이론에 대한 공식적인 지식이 부족하다는 것을 보여줄 수있다). 당신은 0 고유 값이 있다면, 우리는 예를 들어 임을 보여준다 . 이 제약 조건은 Q에 숨겨진 확률 분포 P를 참조하지 않습니다 (이 데모에 대한 영리한 포인트라고 생각합니다). 그러나 P 를 참조하지 않고 X 1 = X 2 를 갖는 것은 무엇을 의미 합니까? 아니면 P δ ( X 1X 2 )X1=X2PQX1=X2PPδ(X1X2)그러나 델타 함수에서 X 1X 2선형 조합 X1X2 이어야한다는 것을 어떻게 알 수 있습니까?
Adam

이 상황에서 "델타 기능"의 사용을 이해하지 못하는 것 같습니다, Adam. 그것은 부분적으로 필자가 필요로하지 않기 때문에, 부분적으로 표기법이 모호하기 때문입니다. 예를 들어 크로네 커 델타 또는 디락 델타일까요?
whuber

변수 (개별적이거나 연속적인)에 따라 Kronecker 또는 Dirac입니다. 이 델타의가, 예를 들어, 내가 2에 의해-2 행렬을 통해 통합 통합 측정의 일부가 될 수있는 (그래서 네 실제 변수 X 1 , X 2 , X 3X 4 체중와 함께, (예를 들어 P = EXP ( - t의 R ( M . M T가 ) ) ) 또는 I 서브 그룹 적분.이 대칭 행렬 (예를 들어 의미있는 경우 X 2 = X 3MX1X2X3X4P=exp(tr(M.MT))X2=X3)에 δ ( X 1 - X 2 ) 를 곱하여 공식적으로 부과 할 수 있습니다 . 이것은 선형 제약 조건입니다. 비선형 구속 조건의 예는 Martijn Weterings의 답변 아래 주석에 나와 있습니다. Pδ(X1X2)
Adam

문제는 다음과 같습니다. 변수에 추가 할 수있는 비선형 구속 조건 중 어떤 것이 0 고유 값을 유도 할 수 있습니까? 귀하의 답변에 따르면 : 선형 제약 조건을 의미하는 비선형 구속 조건 만 (Martijn Weterings의 답변 아래 주석에 설명 된 것처럼). 어쩌면 문제는 내가 문제를 생각하는 방식이 물리학 자의 관점에서 나왔고 다른 언어로 설명하려고 애쓰는 것입니다 (물리학이 아닌이 질문을하기에 적합한 곳이라고 생각합니다).
Adam

5

선형 독립성은 충분할뿐만 아니라 필요한 조건

변수가 선형 적으로 독립적이지 않은 경우에만 분산 공분산 행렬의 고유 값이 0과 동일 함을 나타 내기 위해 "행렬이 고유 값이 0 인 경우 변수가 선형 적으로 독립적이지 않음"만 표시됩니다.

대해 고유 값이 0 이면 선형 조합이 있습니다 (고유 벡터 v로 정의 됨 )Cij=Cov(Xi,Xj)v

Y=i=1nvi(Xi)

그런

Cov(Y,Y)=i=1nj=1nvivjCov(Xi,Xj)=i=1nvij=1nvjCij=i=1nvi0=0

이는 가 상수 여야하므로 변수 X i 상수까지 더해져야하며 상수 자체 (사소한 경우)이거나 선형 적으로 독립적이지 않습니다.YXi

방정식의 첫 번째 줄 은 공분산 Cov ( a U + b V , c W + d X ) = a cCov(Y,Y)

Cov(aU+bV,cW+dX)=acCov(U,W)+bcCov(V,W)+adCov(U,X)+bdCov(V,X)

-두 번째 줄부터 세 번째 줄까지의 단계는 0 고유 값 n j = 1 v j C i j = 0 의 속성 때문입니다

j=1nvjCij=0


비선형 제약

따라서 선형 구속 조건은 (충분한 것이 아니라) 필요한 조건 이므로 비선형 구속 조건은 (필요한) 선형 구속 조건을 간접적으로 암시하는 경우에만 관련됩니다.

실제로, 제로 고유 값과 관련된 고유 벡터와 선형 제약 사이에는 직접적인 대응 관계가 있습니다.

Cv=0Y=i=1nviXi=const

따라서 고유 값이 0이되는 비선형 구속 조건을 결합하면 선형 구속 조건을 생성해야합니다.


비선형 구속 조건이 선형 구속 조건을 발생시키는 방법

주석의 예제는 비선형 구속 조건이 파생을 반전하여 선형 구속 조건으로 이어지는 방법을 직관적으로 보여줄 수 있습니다. 다음 비선형 제약

a2+b2=1c2+d2=1ac+bd=0adbc=1

로 줄일 수 있습니다

a2+b2=1c2+d2=1ad=0b+c=0

이것을 반대로 할 수 있습니다. 비선형 + 선형 구속 조건이 있다고 가정하면 선형 구속 조건을 비선형 구속 조건에 채워서 선형 구속 조건 중 하나를 비선형 구속 조건으로 대체 할 수있는 방법을 상상하는 것은 이상하지 않습니다. 예를 들면 우리는 대체 때 = DB = - (C)를 비선형 형태 2 + B 2 = 1 다음 다른 관계 수 D - B C = 1 . 그리고 a = dc = - 를 곱 하면a=db=ca2+b2=1adbc=1a=dc=b then you get ac=bd.


I guess this (and the answer by whuber) is an indirect answer to my question (which was : "is linear dependence the only way to obtain a zero eigenvalue") in this way : even if the dependence between the random variables is non-linear, it can always be rewritten as a linear dependence by just writing Y=iνiXi. Although I was really looking for way to characterize the possible non-linear constraints themselves, I guess it is nevertheless a useful result.
Adam

Yes, I know... what I'm saying is that if there is a non-linear dependence and there is a zero eigenvalue, then by your answer, it means that the non-linear dependence can be "factored" in some way into a linear dependence. It is a weaker version of what I was looking for, but still something.
Adam

귀하의 예가 효과가 없다는 것을 의미하는 것은 아닙니다.
Adam

여기 당신의 말에 대한 반례가 있습니다 (그렇지 않다고 생각하면 문제의 공식에 문제가있는 것을 찾는 데 도움이 될 수 있습니다 :)) : 2x2 랜덤 행렬을 가져옵니다 미디엄상기와 비선형 제약미디엄.미디엄=1데트미디엄=1. 이 3 개의 비선형 제약 조건은 2 개의 선형 제약 조건과 1 개의 선형 측면에서 다시 작성할 수 있습니다. 공분산 행렬에는 2 개의 고유 벡터가 있음을 의미합니다. 구속 조건 제거데트미디엄=1그리고 그들은 사라집니다.
Adam

M11=X1, M12=X2, M21=X3 and M22=X4. The constraints are X12+X22=1, X32+X42=1, X1X3+X2X4=0 (only two are independent). They do not imply a zero eigenvalue. However, adding X1X4X2X3=1 does imply two eigenvectors with 0 eigenvalues.
Adam

2

가정 고유 벡터가있다 V 해당 고유 값 0그런 다음 var(V엑스)=VV=0. 체비 쇼프의 불평등에 의해V엑스 거의 항상 일정하고 V이자형[엑스]. 즉, 모든 제로 고유 값은 선형 제한, 즉V엑스=V이자형[엑스]. 특별한 경우를 고려할 필요가 없습니다.

따라서 다음과 같이 결론을 내립니다.

"제로 고유 값을 유도하는 유일한 방법은 선형 구속 조건입니까?

예.

"임의의 변수에 대한 비선형 구속 조건이 C의 0 고유 값을 생성 할 수 있습니까?"

예, 선형 제약 조건을 의미하는 경우 가능합니다.


동의한다. 나는 비선형 제약의 종류에 대해 더 구체적이기를 희망했지만 제약을 지정하지 않으면 더 잘하기가 어렵다고 생각합니다.
Adam

2

공분산 마 릭스 엑스 대칭이므로 다음과 같이 진단 할 수 있습니다. =Λ대각 행렬의 고유 값으로 Λ. 이것을 다음과 같이 재 작성 Λ=rhs는 공분산 행렬입니다 엑스따라서 lhs의 제로 고유 값은 선형 조합에 해당합니다. 엑스 변성 분포로.


이것은 매우 간결한 설명이지만 어떻게 더 직관적으로 만들 수 있습니까? =코브(엑스)?
Sextus Empiricus
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.