모든 상관 행렬이 양의 명확한가?


11

여기서 피어슨 상관의 행렬에 대해 이야기하고 있습니다.

나는 종종 모든 상관 행렬이 양의 반올림해야한다고 들었습니다. 내 이해는 양의 정한 행렬의 고유 값이 이어야하고 양의 반정의 행렬의 고유 값 이 있어야한다는 것 입니다. 이것은 내 질문을 "상관 행렬이 고유 값 을 가질 수 있습니까?" 로 표현 될 수 있다고 생각합니다.0 = 0>00=0

상관 행렬 (실종 데이터가없는 경험적 데이터에서 생성됨)이 고유 값 또는 고유 값 을 가질 수 있습니까? 대신 모집단 상관 행렬 인 경우 어떻게합니까?< 0=0<0

나는 정상 응답에서 읽을 공분산 행렬에 대한이 질문에

세 개의 변수 , 및 고려하십시오 . 그들의 공분산 행렬 은 가 양수가 아닌 벡터 ( )가 때문에 양의 이 아닙니다.Y Z = X + Y M의 Z = ( 1 , 1 , - 1 ) ' Z ' M의 ZXYZ=X+YMz=(1,1,1)zMz

그러나 공분산 행렬 대신 상관 행렬에서 이러한 계산을 수행하면 는 양수로 나타납니다. 따라서 상관 관계와 공분산 행렬의 상황이 다를 수 있다고 생각합니다.zMz

내가 묻는 이유는 내가 묻는 질문과 관련하여 stackoverflow 에 대해 요청을 받았기 때문입니다.


예를 들어 이름이 다른 두 속성이 하나 인 경우 행렬은 특이합니다. 이 개 속성이 일정에 추가하면, 다시 단수 시저 나 등 .
ttnphns

공분산 행렬이 단수 인 경우 상관 행렬도 단수입니다.
ttnphns

2
거의 중복 : 모든 상관 행렬이 양의 반정의입니까? 어느 것이 명확한 대 반한 각에 초점이 덜하고, 모든 공분산 행렬이 양의 명확한가? 공분산은 본질적으로 재조정 된 상관 관계이므로 관련이 있습니다.
Silverfish

답변:


16

상관 행렬은 양의 명확한 값일 필요는 없습니다.

0이 아닌 분산을 갖는 스칼라 랜덤 변수 X를 고려하십시오. 그런 다음 X와의 상관 관계 행렬은 모든 것의 행렬이며, 양의 반정은되지만 양의 정은 아닙니다.

샘플 상관에 관해서는, 제 1 관측치 1 및 1, 및 제 2 관측치 2 및 2를 갖는 상기에 대한 샘플 데이터를 고려한다. 이는 샘플 상관이 모든 것의 매트릭스이므로, 양의 결정적인 것은 아니다.

정확한 산술로 계산 된 경우 (즉, 반올림 오류가없는) 샘플 상관 행렬은 음의 고유 값을 가질 수 없습니다.


4
샘플 상관 행렬에 결 측값이 미치는 영향에 대해 언급 할 가치가 있습니다 . 수치 적 퍼지가 표본 상관 / 공분산 행렬에서 음의 고유 값을 얻는 유일한 이유는 아닙니다.
Silverfish

1
예, 나는 그것을 명시 적으로 만들지 않았지만 질문 문에 따르면 "누락 된 데이터가 없다"고 가정했습니다. 데이터가 누락되고 조정이 거친 엉뚱한 세상에 들어가면 아무 일도 일어나지 않습니다.
마크 L. 스톤

예, 죄송합니다. 질문에 "누락 된 데이터가 없습니다"라고 말한 것이 맞습니다. OP의 식욕이 정체되어 있어도 향후 검색자가 관심을 가질 수 있기 때문에 어딘가에 언급 할 가치가 있다고 생각했습니다.
Silverfish

7

@yoki 및 @MarkLStone (모두 +1) 그 밖의 두 점 답변 인구 변수는 선형 (예를 예로서 관련되어 있으면 상관 행렬이 제로 고유 값들을 가질 수 @MarkLStone 그리고 예에서 에서 @yoki의 예).X1=X2X1=2X2

또한, 샘플 상관 행렬은 인 경우, 즉 샘플 크기가 변수의 개수보다 작은 경우 반드시 고유 값이 0 입니다. 이 경우 공분산과 상관 행렬은 모두 최대 순위 이기 때문에 적어도 0의 고유 값이 있습니다. 참조 이유는 샘플 공분산 행렬 단수 샘플 크기가 작은 변수의 수보다 때? 그리고 왜 대부분의 공분산 행렬의 계수 인 ?n<pn1pn+1n1


진정한 'dat. 이 정보도 제공 할 수 있고 제공 했어야한다고 생각하지만 내 목표는 OP의 가설을 반박하는 반례를 만들어서 무효 성을 보여 주지만 두 번째 문장을 "이 경우 공분산 및 상관 행렬로 조정해야합니다. "n은 최대 n-1이 될 것이므로 적어도 (p-n + 1) 0의 고유 값이있을 것입니다."
Mark L. Stone

4

고려 평균 0과 1하자의 변화와 RV으로 , 그리고 공분산 행렬 계산 . 이후 , 및 . 평균 구성이 0이므로 두 번째 모멘트는 적합한 공분산과 같습니다 (예 : .XY=2X(X,Y)2X=YE[Y2]=4E[X2]=σY2E[XY]=2E[X2]Cov(X,Y)=E[XY]EXEY=E[XY]

따라서 공분산 행렬은 고유 값이 0 인 입니다. 상관 행렬은 다음과 같습니다. . 고유 값도 0입니다. 와 의 선형 대응 관계로 인해 왜 우리가이 상관 관계 행렬을 얻는 지 쉽게 알 수 있습니다. 대각선은 항상 1이고 비 대각선은 선형 관계로 인해 1입니다.

Λ=(1224),
Λ=(1111),
XY

나처럼 수학에 어려움을 겪는 독자들을 위해 2, 는 이 마지막 동등성 : . Λcov(X,Y)=E(XY)E(X)E(Y)=2E[X2]=2(σX2+[E(X)]2)E(X2)=Var(X)+[E(X)]2
Antoni Parellada

소식에 +1 수식 을 포함하여 모든 사람이 쉽게 따라갈 수 있기를 원했지만 주석 형식에서는 허용되지 않습니다. 귀하의 게시물에 그것을 포함시키는 데 유효한 포인트가 있다고 생각하십니까? diagΛ1/2ΛdiagΛ1/2
Antoni Parellada

@AntoniParellada, 나는 당신이 무슨 뜻인지 잘 모르겠습니다. 여기의 공분산은 직접 계산입니다. 그러나 나는 그것을 편집하고 더 명확하게 할 것입니다. 감사.
yoki
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.