PCA에서 정확히 "주요 구성 요소"란 무엇입니까?


18

가 설계 행렬 데이터 투영의 분산을 최대화하는 벡터 라고 가정 합니다.uX

이제, 를 데이터의 (제 1) 주요 구성 요소로 지칭하는 재료를 보았습니다 . 이는 또한 고유 값이 가장 큰 고유 벡터입니다.u

그러나 데이터의 주요 구성 요소가 것을 보았습니다 .Xu

분명히 와 는 다른 것입니다. 누구든지 여기에서 나를 도울 수 있고 주성분에 대한이 두 정의의 차이점이 무엇인지 말해 줄 수 있습니까?uXu


고유 벡터 u는 축의 방향입니다 (u의 값은 원래 축에 대한 방향 코사인입니다). Xu는 데이터 자체, 주성분의 값, 위에서 언급 한 축의 좌표)입니다.
ttnphns 2012

답변:


25

(공분산 행렬의 고유 벡터 중 하나, 예를 들어 첫 번째 행렬) 및 (1 차원에 데이터 투영 ) 에도 불구하고 절대적으로 정확 합니다. 된 부분 공간은 서로 다른 두 가지로, 둘 다 종종 "주요 구성 요소"라고하며 때로는 같은 텍스트로 표시됩니다.uXuu

대부분의 경우 문맥에서 정확히 의미하는 것이 분명합니다. 일부 드문 경우에, 그러나, 그것은 참으로 (예 : 스파 스 PCA 또는 CCA 등) 몇 가지 관련 기술은 서로 다른 방향으로, 여기서 논의 할 때 매우, 예를 혼동 할 수있다 직교 할 필요가 없습니다. 이 경우 "컴포넌트는 직교 형"이라는 표현은 축 또는 투영을 나타내는 지 여부에 따라 매우 다른 의미를 갖습니다.ui

나는 를 "주축"또는 "주 방향" 이라고 부르고 를 "주성분" 이라고 옹호 합니다.uXu

또한 "mathcipal component vector"라고 불리는 보았습니다 .u

대체 규칙은 "주요 구성 요소"및 "주요 구성 요소 점수" 를 호출하는 것 입니다.uXu

두 규칙의 요약 :

Convention 1Convention 2u{principal axisprincipal directionprincipal component vectorprincipal componentXuprincipal componentprincipal component scores

참고 : 0이 아닌 고유 값에 해당하는 공분산 행렬의 고유 벡터 만 주 방향 / 구성 요소라고 할 수 있습니다. 공분산 행렬이 낮은 순위이면 하나 이상의 고유 값을 갖습니다. 대응하는 고유 벡터 (및 일정한 영 (0) 인 투영)는 주요 방향 / 구성 요소라고 해서는 안됩니다 . 내 답변에서 토론을 참조하십시오.


1
협약 2는 불법입니다. 기초와 관련하여 기초 벡터와 데이터 벡터의 구성 요소를 둥글게하므로 초보자를 위해 혼동의 끝을 만들 수 없습니다.
추측

로딩 정의는 어떻습니까? 고유 벡터 u의 개별 값을로드합니까?
makis


@amoeba 감사합니다! 마지막 질문입니다. SVD에서 고유 벡터가 U의 열인 경우 X = USVh (Vh : V transposed)의 경우 Vh를로드로 호출 할 수 있습니까?
makis

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.