아무런 차이가 없습니다.
표준 PCA와 C & K가 제안한 "점근 적 PCA"사이에는 전혀 차이가 없습니다. 별도의 이름을 지정하는 것은 매우 어리 석습니다.
다음은 PCA에 대한 간단한 설명입니다. 행에 샘플이있는 중심 데이터가 데이터 행렬 저장된 경우 PCA는 공분산 행렬 고유 벡터를 찾고 이들에 데이터를 투영합니다 주요 성분을 얻기위한 고유 벡터. 마찬가지로, 그람 행렬 고려할 수 있습니다 . 정확히 동일한 고유 값을 가지고 있고 고유 벡터가 스케일 된 PC라는 것을 쉽게 알 수 있습니다. (샘플 수가 피처 수보다 적을 때 편리합니다.)1X11NX⊤X1NXX⊤
C & K가 제안한 것은 주요 구성 요소를 계산하기 위해 그램 행렬의 고유 벡터를 계산하는 것 같습니다. 와우 이것은 PCA와 "동등"하지 않습니다. 그것은 이다 PCA.
혼란을 더하기 위해, "점근선 PCA"라는 이름은 PCA가 아닌 요인 분석 (FA)과의 관계를 나타냅니다! 원본 C & K 논문은 월급을 받고 있으므로 다음은 Google 도서에서 제공되는 Tsay, Financial Time Series 분석의 인용문 입니다.
코너 및 Korajczyk (1988)로서 보여 주었다 [기능 번호] 고유 값 - 고유 벡터 [그람 매트릭스]의 분석은 기존의 통계적인 요인 분석 동등하다.→ ∞k→∞
이것이 실제로 의미하는 것은 일 때 PCA는 FA와 동일한 솔루션을 제공한다는 것입니다. 이것은 PCA 및 FA에 대해 이해하기 쉬운 사실이며 C & K가 제안한 것과는 아무런 관련 이 없습니다 . 나는 다음과 같은 스레드에서 그것을 논의했다 :k→∞
결론적으로 C & K는 표준 PCA ( "asymptotic FA"라고도 함)에 대해 "asymptotic PCA"라는 용어를 사용하기로 결정했습니다. 이 용어를 사용하지 않는 것이 좋습니다.