두 개의 랜덤 벡터 및 에 대한 표준 상관 분석 (CCA)에 대한 Wikipedia 를 읽으 면서 때 주성분 분석 (PCA)이 CCA와 동일한 지 궁금합니다 .
두 개의 랜덤 벡터 및 에 대한 표준 상관 분석 (CCA)에 대한 Wikipedia 를 읽으 면서 때 주성분 분석 (PCA)이 CCA와 동일한 지 궁금합니다 .
답변:
하자 수 및 수 두 데이터 집합을 나타내는 데이터 매트릭스 샘플 (무작위로 행 벡터의 예를 관찰 와 그들 각각을).
CCA는 에서 변수 의 선형 조합과 에서 변수 의 선형 조합을 서로 최대로 상관되도록합니다. 그런 다음 첫 번째 쌍과의 상관 관계가 0 인 제약 조건에서 다음 쌍을 찾습니다. 기타
경우 (및 ) 한 세트의 모든 선형 조합 소소 상관 것이다 다른 데이터 세트에서 동일한 선형 조합으로한다. 따라서 모든 CCA 쌍은 상관 관계 을 가지며 쌍의 순서는 임의적입니다. 유일하게 남아있는 제약은 선형 조합이 서로 상관이 없어야한다는 것입니다. 상관되지 않은 선형 조합 을 선택하는 방법에는 무한한 방법이 있으며 ( 차원 공간 에서 가중치가 직교 할 필요는 없음 ) 이들 중 어느 것도 유효한 CCA 솔루션을 생성합니다. 두 PC의 상관 관계가 0이므로 이러한 방법 중 하나가 PCA에 의해 실제로 제공됩니다.
따라서 PCA 솔루션은 실제로 유효한 CCA 솔루션이 될 것입니다. 그러나이 경우 무한한 수의 CCA 솔루션이 있습니다.
수학적으로 CCA는 오른쪽 ( ) 및 왼쪽 ( ) 특이 벡터를 찾습니다. 이 경우 와 동일 하며 모든 벡터는 고유 벡터 임) 따라서 는 임의적 일 수 있습니다. 그런 다음 CCA는 선형 조합 가중치를 및 로 얻습니다 . 이 경우에는 임의의 기준을 취하고 그것을 변환 귀결 , 상관 방향을 실제로 생성한다 .
vectors X and Y
두 변수 (데이터 열) 또는 두 경우 (행)입니까? 변수 분석을 수행 할 것입니다. 2)X and Y are the same
X = Y 또는 다른 방법으로 말하고 싶습니까?