내가 이해하는 한, 주요 구성 요소는 좌표축을 회전하여 최대 분산 방향에 정렬하여 얻습니다.
그럼에도 불구하고, 나는 "회전하지 않은 주성분"에 대해 계속 읽고 있으며, 통계 소프트웨어 (SAS)는 회전하지 않은 주성분뿐만 아니라 varimax로 회전 된 주성분을 제공합니다. 여기서 혼란스러워합니다. 주성분을 계산할 때 축이 이미 회전되어 있습니다. 그렇다면 또 다른 회전이 필요한 이유는 무엇입니까? "회전하지 않은 주성분"이란 무엇입니까?
내가 이해하는 한, 주요 구성 요소는 좌표축을 회전하여 최대 분산 방향에 정렬하여 얻습니다.
그럼에도 불구하고, 나는 "회전하지 않은 주성분"에 대해 계속 읽고 있으며, 통계 소프트웨어 (SAS)는 회전하지 않은 주성분뿐만 아니라 varimax로 회전 된 주성분을 제공합니다. 여기서 혼란스러워합니다. 주성분을 계산할 때 축이 이미 회전되어 있습니다. 그렇다면 또 다른 회전이 필요한 이유는 무엇입니까? "회전하지 않은 주성분"이란 무엇입니까?
답변:
이것은 기술적이지 않은 답변이 될 것입니다.
당신이 맞습니다 : PCA는 본질적으로 좌표축의 회전이며, 각 성공적인 축은 가능한 한 많은 차이를 포착하도록 선택됩니다.
심리학과 같은 일부 분야에서 사람들은 결과 축을 해석하기 위해 PCA를 적용하는 것을 좋아합니다. 즉, 주축 # 1 (원래 변수의 특정 선형 조합 임)에 특정 의미가 있다고 말할 수 있기를 원합니다. 이 의미를 추측하기 위해 선형 조합의 가중치를 볼 수 있습니다. 그러나 이러한 가중치는 종종 지저분하며 명확한 의미를 식별 할 수 없습니다.
이 경우 사람들은 때때로 바닐라 PCA 솔루션으로 약간의 문제를 해결하려고합니다. 그들은 (어떤 기준에 의해 "의미있는"것으로 간주된다) 주축의 특정 번호를 가지고 가고, 또한 쉽게 해석 할 수있을 것이다, 선형 조합 일부 "단순한 구조를"--- 달성하기 위해 노력하고, 그들에게 돌립니다. 가장 간단한 구조를 찾는 특정 알고리즘이 있습니다. 그중 하나를 varimax라고합니다. varimax 회전 후, 후속 컴포넌트는 더 이상 가능한 많은 편차를 캡처하지 않습니다! 추가 varimax (또는 다른) 회전을 수행하여 PCA의이 기능이 손상됩니다.
따라서 varimax 회전을 적용하기 전에 "회전하지 않은"주성분이 있습니다. 그런 다음 "회전 된"기본 구성 요소를 얻게됩니다. 즉,이 용어는 PCA 회전 자체가 아니라 PCA 결과의 사후 처리를 나타냅니다 .
이 모든 것은 회전하는 것이 주축이 아닌 하중이기 때문에 다소 복잡합니다. 그러나 수학적 세부 사항을 보려면 여기에 긴 대답을 드리겠습니다. PCA와 회전 (varimax 등)이 여전히 PCA입니까?
what gets rotated are loadings and not principal axes as such
나는 이것이 기술적 개념이라고 덧붙일 것이다. 이론적으로,이 두 회전 종류는 병렬입니다. PCA에서 우리는 특정 직교 기저 (고유 가치의 가파른 도표를 가진 것)를 찾기 위해 회전합니다. varimax에서, 우리는 다른 특정 직교 기저를 찾기 위해 회전합니다 (가장 인터 페터 블 구조로). 우리는 모든 종류의 직교 기반을 할 수 있습니다.