순위 상관을 사용한 정식 상관 분석


15

정식 상관 분석 (CCA)은 두 데이터 세트의 선형 조합에 대한 일반적인 Pearson 곱-모멘트 상관 (즉, 선형 상관 계수)을 최대화하는 것을 목표로합니다.

이제이 상관 계수가 선형 연관 만 측정한다는 사실을 고려하십시오. 이것이 우리가 예를 들어 Spearman- ρ 또는 Kendall- τ (순위) 상관 계수를 사용하는 이유이기도합니다. 변수 사이의 연결.

따라서 CCA의 한 가지 한계는 목적 함수로 인해 형성된 선형 조합 간의 선형 연관 만 캡처하려고한다는 것입니다. 말하자면, Spearman- 극대화하여 어떤 의미에서 CCA를 확장하는 것이 가능하지 않을까요 ρ 대신 Pearson- r ?

그러한 절차가 통계적으로 해석 가능하고 의미있는 것을 이끌어 줍니까? (예를 들어, 등급에 CCA를 수행하는 것이 합리적입니까? ...) 비정규 데이터를 처리 할 때 도움이 될지 궁금합니다.


4
OVERALS 정식 상관 관계를 극대화하기 위해 선형 표준 분석하는 최적 규모 (단조의 변환) 변수 - - 원하는대로 할 수?
ttnphns

@ttnphns : 아이디어 주셔서 감사합니다, 나는 그것을 들어 본 적이 없으며, 정말 재미있어 보인다! 그러나 나는 그것이 요점을 다루지 않는다고 생각합니다. 내가 이해하는 한, 그것은 본질적으로 최적의 스케일링과 CCA의 조합이지만 최적의 스케일링은 범주 형 변수에만 실제로 의미가 있습니다. 비율 척도로 측정 된 연속 변수 (내 마음 속에있는 것)에 대해서는 크게 변하지 않는 것 같습니다 . 그러나 내가 틀렸다면 나를 바로 잡으십시오.
Tamas Ferenci

1
@ttnphns : 글쎄, 때때로 연속 변수에 대해 Spearman 상관 관계를 사용하는 것과 같은 방식! (물론 그것은 데이터를 서수로 취급합니다 ...하지만 우리는 변수 사이의 일반적인 모노톤 (선형뿐만 아니라) 연관성을 특성화하기 위해 확실히 연속 변수에 데이터를 사용합니다.) 이것이 CCA 내에서도 의미가 있다고 생각하는 이유입니다. ...
Tamas Ferenci

@Glen_b, 당신 말이 맞아요. 물론 순위 상관 관계는 순서 또는 연속 데이터와 같은 모든 단 조성에 대한 것입니다. 위의 내 의견에 너무 놀라서 삭제하고 있습니다.
ttnphns

특히 방사형 기저 함수와 함께 사용하면 데이터를 무한 차원 부분 공간으로 투영 할 수있는 Kernel CCA를 사용해 볼 수 있습니다.
roni

답변:


6

정규 변수를 계산할 때 제한된 입방 스플라인 확장을 사용했습니다. 새 피처를 추가 할 때와 마찬가지로 비선형 기저 함수를 분석에 추가합니다. 그 결과 비선형 주성분 분석이 이루어집니다. 예는 R Hmisc패키지transcan기능을 참조하십시오 . R homals패키지 는 이것을 훨씬 더 발전시킵니다.


1
감사합니다! homals에 설명 된 접근법은 나에게 새롭지 만 확실히 흥미 롭습니다.
Tamas Ferenci

4

CCA의 표준 방법은 제품 모멘트 상관 계수 매트릭스와 함께 작동합니다. 가장 큰 mgnitude CC의 경우 abs (상관 (z1, z2))가 최대화되도록 두 개의 matix (n 개의 행 및 m1 및 m2 변수)의 선형 조합으로 두 개의 복합 변수 z1 (n) 및 z2 (n)을 구성합니다. 이 목적 함수는 상관 관계 (z1, z2)가 제품 모멘트가 아니라 다르게 정의 된 경우에도 직접 최대화 될 수 있습니다.

SK Mishra (2009) "두 세트의 순위 점수의 서수 정식 상관 분석에 관한 메모"

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.