표본의 공분산 행렬을 계산할 때 대칭적이고 양의 유한 행렬을 얻을 수 있습니까?
현재 내 문제에는 4600 개의 관측 벡터와 24 차원의 샘플이 있습니다.
표본의 공분산 행렬을 계산할 때 대칭적이고 양의 유한 행렬을 얻을 수 있습니까?
현재 내 문제에는 4600 개의 관측 벡터와 24 차원의 샘플이 있습니다.
답변:
벡터의 샘플 와, 샘플 평균 벡터이다
및 표본 공분산 행렬은
0이 아닌 벡터 경우
y ^ \ top Qy = y ^ \ top \ left (\ frac {1} {n} \ sum_ {i = 1} ^ n (x_i- \ bar {x}) (x_i- \ bar {x}) ^ \ top \ right) y
= \ frac {1} {n} \ sum_ {i = 1} ^ ny ^ \ top (x_i- \ bar {x }) (x_i- \ bar {x}) ^ \ top y
= \ frac {1} {n} \ sum_ {i = 1} ^ n \ left ((x_i- \ bar {x}) ^ \ top y \ 오른쪽) ^ 2 \ geq 0 \,. \ quad (*)
따라서 Q 는 항상 양의 반정도 입니다.Q = 1
에 대한 추가 조건 긍정적하는 명확한 whuber의 코멘트 울부 짖는 소리에 주어졌다. 다음과 같이 진행됩니다.
정의 에 대한 . 용 제로가 아닌 , 제로의 경우에만 마다, . 세트 가정 스팬 . 그런 다음, 과 같은 실수 있습니다. 그러나 우리는 이므로 모순되는 됩니다. 따라서 의 범위 인 경우r a n k [ z 1 … z n ] = k긍정적 인 확실하다 . 이 조건은 .
올바른 공분산 행렬은 대칭과 긍정적 인 *의 항상 반은 명확한 *.
두 변수 간의 공분산은 됩니다.
와 의 위치를 바꾸더라도이 방정식은 바뀌지 않습니다 . 따라서 행렬은 대칭이어야합니다.y
또한 다음과 같은 이유로 양의 * 반 *의 값 이어야합니다 .
공분산 행렬이 대각선이되는 방식으로 변수의 변형을 항상 찾을 수 있습니다. 대각선에서, 변환 된 변수의 분산이 0이거나 양인 것을 알 수 있습니다. 이로 인해 변환 된 행렬이 양의 반정의임을 알 수 있습니다. 그러나, 정의의 정의는 변형 불변이므로, 공분산 행렬은 임의의 선택된 좌표계에서 양의 반정의이다.
위에서 언급 한 공식을 사용 하여 공분산 행렬 을 추정 하면 (즉, 표본 공분산 을 계산할 때 ) 관측되지 않습니다. 여전히 대칭 적입니다. 또한 각 표본에 대해 각 표본 점에 동일한 확률을 제공 하는 pdf 가 공분산으로 표본 공분산을 갖기 때문에 (누군가 이것을 확인하십시오) 위의 모든 내용이 여전히 적용 되기 때문에 양의 반올림해야합니다 (제 생각에) .
분산-공분산 행렬은 상기 행렬의 각 항을 계산하기 위해 실제 방정식으로부터 입증 될 수 있기 때문에 항상 대칭이다.
또한 분산-공분산 행렬은 항상 크기가 n 인 정사각 행렬입니다. 여기서 n은 실험의 변수 수입니다.
대칭 행렬의 고유 벡터는 항상 직교합니다.
PCA를 사용하면 실험에 사용 된 변수의 수를 줄일 수 있는지 확인하기 위해 행렬의 고유 값을 결정합니다.
나는 왜 우리가 종종 공분산 행렬이 이면 양의 양의 한정이라고 말하는지를 설명하는 Zen의 멋진 주장에 덧붙일 것 입니다.
경우 은 연속 확률 분포의 랜덤 표본이고 x 1 , x 2 , 입니다. . . , x를 N (확률 이론 관점에서) 거의 확실 선형 독립적이다. 이제, Z 1 , Z 2 , . . . , z n 은 선형 적으로 독립적이지 않습니다. ∑ n i = 1 z i = 이지만 x 1 , x 2 , 때문입니다 . . . , x n 은 선형 독립적 인 z 1 , z 2 , … . . , Z N 스팬 등 R N - 1 . 만약 N - 1 ≥ K , 그들은 또한 스팬 R의 K .
경우, 결론적으로 은 연속 확률 분포의 랜덤 표본이고 n - 1 ≥ k 이면 공분산 행렬은 양의 유한 한 값입니다.
추상적 인 수학 공식을 빨리 잡지 못하는 저와 같은 수학적 배경을 가진 사람들에게 이것은 가장 많이 찬성 된 답변을위한 훌륭한 예입니다. 공분산 행렬은 다른 방식으로도 도출 될 수 있습니다.