공분산 행렬의 순위가 최대 이유는 무엇 입니까?


17

질문 에서 언급했듯이 공분산 행렬의 최대 순위는 n1 이며 여기서 n 은 표본 크기이므로 공분산 행렬의 차원이 표본 크기와 같으면 단수입니다. 공분산 행렬 의 최대 순위 n 에서 1 을 빼는 이유를 이해할 수 없습니다 .n


1
직감을 얻으려면 3D에서 점을 생각하십시오 . 이 점들이 속하는 부분 공간의 차원은 무엇입니까? 라인에 맞출 수 있습니까 (1D 부분 공간)? 아니면 평면 (2D 부분 공간)이 필요합니까? n=2
amoeba는 Reinstate Monica가

따라서 가 1 공분산 행렬로 이어진다는 것을 알고 있습니까? 자, 점을 봅시다 . 항상 2D 평면에 맞출 수 있다는 것을 알 수 있습니까? n=2n=3
amoeba는 Reinstate Monica가

4
@amoeba 귀하의 예는 분명하지만 귀하의 예에 초평면을 맞추는 것과 공분산 행렬 사이의 관계가 무엇인지 이해할 수 없습니까?
user3070752

지연 죄송합니다;)
user3070752

답변:


20

데이터 포인트 가 주어진 경우 샘플 공분산 행렬의 편견 추정값 은 여기서 은 모든 포인트에 대한 평균입니다. 나타낸다 우리를 보자 로 . 계수 순위를 변경하지 않고, 요컨대, 각 용어는 랭크 (정의)를 갖는다 문제의 핵심은 다음과 같은되도록 :nxiRd

C=1n1i=1n(xix¯)(xix¯),
x¯=xi/n(xix¯)zi1n11

이유는 무엇입니까 이 순위 이 아닌 순위 , 우리가 합산되기 때문에이 보일 것 같은 rank- 행렬을?zizin1nn1

대답은 가 독립적이지 않기 때문에 발생한다는 것 입니다. 구성에 의해 z i = 0 입니다. 따라서 z in - 1 을 아는 경우 마지막 남은 z n 이 완전히 결정됩니다. 우리는 n 개의 독립 랭크 -1 행렬을 합산하지 않고 , n - 1 개의 독립 랭크 -1 행렬 만을 합산 한 다음 나머지에 의해 완전히 선형으로 결정된 하나 이상의 랭크 -1 행렬 을 추가 합니다. 이 마지막 추가는 전체 순위를 변경하지 않습니다.zizi=0n1ziznn1n111

우리는 다시 쓸 경우 직접 볼 수 으로 Z N = - N - 1 Σ= 1 Z , 현재 상기 식 끼우 : N Σ는= 1 개 , Z의 I의 Z = N - 1 Σ= 1 개 , Z의 I의 Z I + ( - N - 1 Σ I = 1zi=0

zn=i=1n1zi,
이제합계에 n - 1 항만 남았으며 전체 합이 최대 n - 1 순위를 가질 수 있음이 분명해졌습니다.
i=1nzizi=i=1n1zizi+(i=1n1zi)zn=i=1n1zi(zizn).
n1n1

그런데이 결과는 공분산의 편향 추정량의 요인이 1 인 이유를 암시합니다. 아닌 n - 11n1 .1n

n1x¯


0

조금 더 짧은 설명은 다음과 같습니다.

nmxnm

xmin(n,m)

nmz

z=xE[x]

min(n,m1)

i=1mzi=0

z

x

cov(x,x)=1m1zzT

rank(zzT)

rank(zzT)=rank(z)=min(n,m1)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.