많은 통계 교과서는 공분산 행렬의 고유 벡터가 무엇인지에 대한 직관적 인 그림을 제공합니다.
벡터 u 및 z 는 고유 벡터를 형성한다 (웰, 고유 축). 이것은 말이됩니다. 그러나 나를 혼란스럽게하는 것은 원시 데이터가 아닌 상관 행렬 에서 고유 벡터를 추출한다는 것 입니다. 또한, 매우 다른 원시 데이터 세트는 동일한 상관 행렬을 가질 수 있습니다. 예를 들어, 다음은 상관 행렬이 모두 있습니다.
따라서 동일한 방향을 가리키는 고유 벡터가 있습니다.
그러나 고유 벡터가 원시 데이터에있는 방향에 대해 동일한 시각적 해석을 적용하면 벡터가 다른 방향을 가리키게됩니다.
누군가 내가 잘못한 곳을 말해 줄 수 있습니까?
두 번째 편집 : 내가 대담 할 수 있다면 아래의 훌륭한 답변을 통해 혼란을 이해할 수 있었고 설명했습니다.
시각적 설명은 공분산 행렬 에서 추출 된 고유 벡터 가 서로 다르다는 사실과 일치합니다 .
공분산과 고유 벡터 (빨간색) :
공분산과 고유 벡터 (파란색) :
상관 행렬은 표준화 된 변수의 공분산 행렬을 반영합니다. 표준화 된 변수를 육안으로 검사하면 동일한 고유 벡터가 추출되는 이유를 알 수 있습니다.
[PCA]
태그를 유지합니다 . 질문에 다시 초점을 맞추거나 새로운 (관련) 질문 및이 링크를 묻는다면 괜찮아 보이지만이 질문은 태그를 쓸만한 PCA라고 생각합니다.