“인자 분석의 기본 정리”는 PCA에 어떻게 적용됩니까? 또는 PCA 로딩은 어떻게 정의됩니까?


14

저는 현재 "인자 분석"(PCA)에 대한 슬라이드 세트를 사용하고 있습니다.

여기에서 분석에 들어가는 데이터의 상관 행렬 ( )을 인자 로딩 행렬 ( A )을 사용하여 복구 할 수 있다고 주장하는 "인자 분석의 기본 정리"가 도출됩니다 .RA

R=AA

그러나 이것은 나를 혼란스럽게합니다. PCA에서 "인자 로딩"의 행렬은 데이터의 공분산 / 상관 행렬의 고유 벡터 행렬에 의해 주어진다 (데이터가 표준화되었다고 가정하기 때문에 동일하므로). 길이 하나. 이 행렬은 이에 직교 = I 일반적으로 동일하지 R .AA=IR


@amoeba의 대답 외에도 내 대답 에서 용어의 모호성을 추가합니다. A명확성을 이유로 고유 벡터 행렬 (로드 중) 을 호출하지 않는 것이 좋습니다 . (오른쪽) 고유 벡터 행렬은 일반적으로 V( R=USV'svd 때문에 ) 레이블이 아닌 레이블이 붙어 A있습니다. 고유 벡터에 대한 또 다른 동등한 이름 ​​(biplot 용어에서 유래)은 "표준 좌표"이며 하중에 대해서는 "주 좌표"입니다.
ttnphns

( "표준 좌표"-관성 또는 고유 값의 스케일이 부여 될 때 단위 크기이므로 "주 좌표"-부여 할 때 원래의 전체 크기이기 때문에)
ttnphns

답변:


17

이것은 용어 적 모호성과 혼란에서 비롯된 합리적인 질문 (+1)입니다.

PCA와 관련하여 사람들은 종종 주축 (공분산 / 상관 행렬의 고유 벡터)을 "부하"라고 부릅니다. 이것은 조잡한 용어입니다. PCA에서 "로드"라고하는 것은 각각의 고유 값의 제곱근에 의해 스케일링 된 주축입니다. 그러면 당신이 말하는 정리가 붙잡을 것입니다.

아르 자형=V에스V
V에스
=V에스1/2,
아르 자형=.
아르 자형아르 자형
아르 자형아르 자형아르 자형.

요인 분석 및 PCA 로딩을 사용하여 공분산 행렬을 재구성하는 방법에 대한 자세한 내용은 여기참조하십시오 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.