이 질문은 주로 PCA / FA의 정의에 관한 것이므로 의견이 다를 수 있습니다. 내 의견은 PCA + varimax를 PCA 또는 FA라고 부르지 말고, "varimax-rotated PCA"라고 명시 적으로 언급하는 것입니다.
나는 이것이 매우 혼란스러운 주제라고 덧붙여 야한다. 이 답변에서 나는 회전이 실제로 무엇인지 설명 할 것입니다 ; 이것은 수학이 필요할 것입니다. 일반 독자는 그림으로 바로 건너 뛸 수 있습니다. 그래야만 PCA + rotation이 "PCA"인지 아닌지를 논의 할 수 있습니다.
Jolliffe의 저서 "주성분 분석", 섹션 11.1 "주성분의 회전"을 참조하지만 더 명확 할 수 있습니다.
하자 될 N × P는 우리가 중심 가정 데이터 매트릭스. PCA 는 단일 값 분해에 해당합니다 ( 여기서 내 대답 참조 ) : X = U S V ⊤ . 이 분해에는 PCA 스타일의 "투영"보기와 FA 스타일의 "잠재적 변수"보기라는 두 가지의 동등한보기가 있습니다.Xn×pX=USV⊤
PCA 스타일의 견해에 따르면, 우리는 많은 직교 방향 (이것은 공분산 행렬의 고유 벡터 ( "주 방향"또는 "축"이라고도 함))와 "주성분" U S (주성분 " 점수 ")는 이러한 방향에 대한 데이터의 예측입니다. : 주성분이 무상관, 제 하나는 쓸 수 가능한 최대한 분산 등 갖는다 X = U S ⋅ V ⊤ = 스코어 ⋅ 주 방향 .VUS
X=US⋅V⊤=Scores⋅Principal directions.
FA 스타일의 견해에 따르면, 우리는 "적재"를 통해 관측 된 변수를 야기하는 상관되지 않은 단위 분산 "잠재적 요인"을 발견했습니다. 실제로 는 표준화 된 주성분 (비 관계 및 단위 분산)이며 하중을L=VS/ √ 로 정의하면U˜=n−1−−−−−√U 이면 X= √L=VS/n−1−−−−−√( S ⊤=S입니다.) 두보기는 동일합니다. 하중은 각각의 고유 값 (S/ √)으로 스케일 된 고유 벡터입니다.
X=n−1−−−−−√U⋅(VS/n−1−−−−−√)⊤=U˜⋅L⊤=Standardized scores⋅Loadings.
S⊤=S 은 공분산 행렬의 고유 값입니다).
S/n−1−−−−−√
( PCA FA 인≠ 괄호를 추가해야합니다 . FA는 명시 적으로 로딩을 통해 관측 된 변수에 선형으로 매핑 된 잠재 요인을 찾는 것을 목표로합니다. PCA보다 유연하고 다른 로딩을 생성합니다. 따라서 위의 " FA가 아닌 PCA에 대한 FA 스타일보기 "(FA가 아닌 FA 방법 중 하나라고 생각하더라도)
이제 회전은 무엇을합니까? 예를 들어, varimax와 같은 직교 회전. 먼저, 성분, 즉 X ≈ U k S k V ⊤ k = ~ U k L ⊤ k 만 고려 합니다. 그럼 사각 직교 얻어 K × K의 행렬 T를 , 및 플러그 T T ⊤ = I를 이것으로 분해 : X ≈ U k 개의 S의 유전율 V ⊤ K = Uk<p
X ≈ U케이에스케이V⊤케이=U˜kL⊤k.
k×kTTT⊤=I 여기서 회전 하중은
L r o t = L k T 로 주어지고, 회전 된 표준화 된 점수는
~ U r o t = ~ 로 주어진다
U는 케이 T를 . (이 목적은
L r o t 와 같은
T 를 찾는 것입니다.
X≈UkSkV⊤k=UkTT⊤SkV⊤k=U˜rotL⊤rot,
Lrot=LkT유~R o t= U~케이티티엘R o t 해석을 용이하게하기 위해 가능한 한 스파 스에 가까워졌습니다.)
회전되는 것은 (1) 표준화 된 점수, (2) 로딩입니다. 그러나 기본 점수가 아니라 기본 점수가 아닙니다! 따라서 회전 은 원래 공간이 아닌 잠재 공간 에서 발생 합니다. 이것은 절대적으로 중요합니다.
FA 스타일의 관점에서는 별다른 변화가 없었습니다. (A) 잠재 요인은 여전히 상관 관계가 없으며 표준화되어 있습니다. (B) 그것들은 여전히 (회전) 로딩을 통해 관측 된 변수에 매핑됩니다. (C) 각 구성 요소 / 인자에 의해 포착 된 분산의 양은 의 해당 하중 열의 제곱 값의 합으로 제공됩니다 . (D) 기하학적으로, 하중은 여전히 R p 에서 동일한 k- 차원 부분 공간에 걸쳐있다 (제 1 k PCA 고유 벡터에 의해 경간 된 부분 공간 ). (E) X에 대한 근사치 와 재구성 오류는 전혀 변하지 않았다. (F) 공분산 행렬은 여전히 똑같이 대략적으로 근사됩니다. Σ ≈ L엘R o t케이아르 자형피케이엑스
Σ ≈ L케이엘⊤케이= LR o t엘⊤R o t.
그러나 PCA 스타일의 관점은 실제로 무너졌습니다. 회전 하중은 더 이상 직교 방향 / 축에 해당하지 않습니다 . 즉, L r o t 열은 직교하지 않습니다! 더 나쁜 것은, 회전 된 하중에 의해 주어진 방향으로 데이터를 [직교 적으로] 투영하면 상관 된 (!) 투영을 얻게되고 점수를 복구 할 수 없게됩니다. [그 대신에, 회전 후 표준화 된 스코어를 계산하기 위해, 데이터 행렬 에 부하 의 의사 역수 를 곱해야합니다 ~ U r o t = X ( L + r o t ) ⊤아르 자형피엘R o t유~r ot= X ( L+R o t)⊤. 또는 회전 행렬을 사용하여 원래의 표준화 된 점수를 간단히 회전 할 수도 있습니다. ] 또한 회전 된 구성 요소는 최대 분산 량을 연속적으로 캡처 하지 않습니다 . 분산은 구성 요소간에 재분배됩니다. 모든 k 개의 회전 된 구성 요소는 모든 k 개의 원래 주요 구성 요소 만큼 정확하게 분산을 캡처합니다 ).유~R o t= U~티케이케이
여기에 그림이 있습니다. 데이터는 주 대각선을 따라 2D 타원입니다. 첫 번째 주 방향은 주 대각선이고 두 번째 주 방향은 직각입니다. PCA 로딩 벡터 (고유 값으로 스케일링 된 고유 벡터)는 빨간색으로 표시되어 양방향을 가리키며 가시성을 위해 일정한 계수로 늘어납니다. 그럼으로 직교 회전 도포 부가금한다. 결과 로딩 벡터는 자홍색으로 표시됩니다. 그것들이 어떻게 직교가 아닌지 주목하십시오!30∘
FA 스타일의 직관은 다음과 같습니다. 점이 작은 원을 채우는 "잠재적 공간"을 상상해보십시오 (단위 차이가있는 2D 가우시안에서 유래). 이 포인트 분포는 PCA 로딩 (빨간색)을 따라 확장 되어이 그림에서 볼 수있는 데이터 타원이됩니다. 그러나 동일한 분포의 점을 회전 한 다음 회전 된 PCA 로딩 (자홍색)을 따라 늘려서 동일한 데이터 타원 이 될 수 있습니다.
실제로하는 방법 [ 참조 부하의 직교 회전이 있음을 회전은 , 하나는 PCA의 행렬도 볼 필요가있다; 이 단순히 회전 할 원래의 변수에 대응하는 벡터 / 광선.]
요약하자. varimax와 같은 직교 회전 후 "회전 된 주축"은 직교하지 않으며 직교 투영은 의미가 없습니다. 따라서이 전체 축 / 투영 관점을 떨어 뜨려야합니다. 여전히 PCA (최대 분산 등의 투영에 관한 것)라고하는 것은 이상 할 것입니다.
FA 스타일의 관점에서, 우리는 단순히 (표준화되고 상관되지 않은) 잠재 요소를 회전 시켰습니다. 이는 유효한 작업입니다. FA에는 "투영"이 없습니다. 대신 잠복 인자는 하중을 통해 관측 변수를 생성합니다. 이 논리는 여전히 유지됩니다. 그러나 PCA는 FA와 동일하지 않기 때문에 실제로는 요인이 아닌 주요 구성 요소로 시작했습니다. FA라고 부르는 것도 이상합니다.
"PCA 또는 FA"라고 말하는 것이 아니라 "PCA 다음에 varimax 회전"이라는 정확한 사용 절차를 지정하는 데주의를 기울이는 것이 좋습니다.
티 T⊤U SV⊤