동일한 두 데이터 세트 사이의 CCA가이 데이터 세트의 PCA와 동등합니까?


9

두 개의 랜덤 벡터 및 에 대한 표준 상관 분석 (CCA)에 대한 Wikipedia 를 읽으 면서 때 주성분 분석 (PCA)이 CCA와 동일한 지 궁금합니다 .XYX=Y


1) vectors X and Y두 변수 (데이터 열) 또는 두 경우 (행)입니까? 변수 분석을 수행 할 것입니다. 2) X and Y are the sameX = Y 또는 다른 방법으로 말하고 싶습니까?
ttnphns 2016 년

@ttnphns : 1) 와 는 두 개의 랜덤 벡터입니다. 그것들은 무작위 변수의 두 벡터, 두 개의 데이터 열 세트, 두 경우 (행)가 아닙니다. 2) . XYX=Y
Tim

각 집합이 단일 변수로 구성되어있는 경우 두 변수 사이에 정확히 Pearson r 인 하나의 표준 상관 관계가 있습니다. CCA는 Y에 의해 X의 선형 회귀가되고 그 반대도 마찬가지입니다. PCA에 의한 r의 분해는 또 다른 이야기입니다. PCA와 CCA는 다른 분석입니다.
ttnphns 2016 년

안녕하세요, @Tim, 제 답변이 도움이되었는지 또는 궁금한 점이 더 있는지 궁금합니다. 그렇다면 명확하게 설명하겠습니다.
amoeba

@amoeba : 그렇습니다. 지금은 추가 질문이 없으며 나중에 답장을 읽어 드리겠습니다. 답장을 보내 주셔서 감사합니다. +1
Tim

답변:


6

하자 수 및 수 두 데이터 집합을 나타내는 데이터 매트릭스 샘플 (무작위로 행 벡터의 예를 관찰 와 그들 각각을).Xn×p1Yn×p2nXY

CCA는 에서 변수 의 선형 조합과 에서 변수 의 선형 조합을 서로 최대로 상관되도록합니다. 그런 다음 첫 번째 쌍과의 상관 관계가 0 인 제약 조건에서 다음 쌍을 찾습니다. 기타p1Xp2Y

경우 (및 ) 한 세트의 모든 선형 조합 소소 상관 것이다 다른 데이터 세트에서 동일한 선형 조합으로한다. 따라서 모든 CCA 쌍은 상관 관계 을 가지며 쌍의 순서는 임의적입니다. 유일하게 남아있는 제약은 선형 조합이 서로 상관이 없어야한다는 것입니다. 상관되지 않은 선형 조합 을 선택하는 방법에는 무한한 방법이 있으며 ( 차원 공간 에서 가중치가 직교 할 필요는 없음 ) 이들 중 어느 것도 유효한 CCA 솔루션을 생성합니다. 두 PC의 상관 관계가 0이므로 이러한 방법 중 하나가 PCA에 의해 실제로 제공됩니다.X=Yp1=p2=p11pp

따라서 PCA 솔루션은 실제로 유효한 CCA 솔루션이 될 것입니다. 그러나이 경우 무한한 수의 CCA 솔루션이 있습니다.


수학적으로 CCA는 오른쪽 ( ) 및 왼쪽 ( ) 특이 벡터를 찾습니다. 이 경우 와 동일 하며 모든 벡터는 고유 벡터 임) 따라서 는 임의적 일 수 있습니다. 그런 다음 CCA는 선형 조합 가중치를 및 로 얻습니다 . 이 경우에는 임의의 기준을 취하고 그것을 변환 귀결 , 상관 방향을 실제로 생성한다 .abCXX1/2CXYCYY1/2Ia=bCXX1/2aCYY1/2bCXX1/2

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.