Factor Analysis / PCA에서 회전을 수행 한 이유와 적절한 회전을 선택하는 직관적 인 이유는 무엇입니까?


33

내 질문

  1. 요인 분석 (또는 PCA의 구성 요소)에서 요인의 회전을 수행하는 직관적 인 이유는 무엇입니까?

    변수가 최상위 구성 요소 (또는 요인)에 거의 똑같이로드되면 구성 요소를 구별하기가 어렵다는 것을 이해합니다. 따라서이 경우 회전을 사용하여 구성 요소를 더 잘 차별화 할 수 있습니다. 이 올바른지?

  2. 회전을하면 어떤 결과가 발생합니까? 이것은 어떤 영향을 미칩니 까?

  3. 적절한 회전을 선택하는 방법은 무엇입니까? 직교 회전 및 비스듬한 회전이 있습니다. 이 중에서 선택하는 방법과이 선택의 의미는 무엇입니까?

최소한의 수학 방정식으로 직관적으로 설명하십시오. 분산 된 답변 중 수학이 무거웠지만 직관적 인 이유와 규칙에 대해 더 많이 찾고 있습니다.

답변:


34
  1. 회전 사유 . 요인 분석에서 추출 된 요인 (또는 PCA를 요인 분석 기술로 사용하려는 경우 PCA의 구성 요소)을 해석하기 위해 회전이 수행됩니다. 당신의 이해를 설명 할 때 당신은 옳습니다. 로딩 매트릭스의 일부 구조를 추구하여 회전이 이루어지며, 이는 단순 구조 라고 할 수 있습니다 . 다른 요소가 다른 변수를로드하는 경향이있는 경우입니다 11. [변수가 요인을로드하는 것보다 "인자에 변수를로드하는"이라고 말하는 것이 더 옳다고 생각합니다. 왜냐하면 "변수"가 "in"또는 "뒤에"있는 요인이기 때문에 상관이있을 수 있습니다. 어떤 의미에서 전형적인 간단한 구조는 상관 변수의 "클러스터"가 나타나는 곳입니다. 그런 다음 요인에 의해 충분히로드 된 변수의 의미의 교집합 에있는 의미 로 요인을 해석합니다 . 따라서 다른 의미를 갖기 위해서는 요인이 변수를 차등 적으로로드해야합니다. 경험상 요인은 최소한 3 개의 변수를 적절히로드해야한다는 것입니다.

  2. 결과 . 회전은 요인의 공간에서 서로에 대한 변수의 위치를 ​​변경하지 않습니다. 즉, 변수 간의 상관 관계가 유지됩니다. 변경된 것은 가변 벡터의 종점 좌표를 인자 축에 대한 좌표입니다.-하중 (자세한 내용은 "부하 플롯"및 "바이 플롯"에 대해서는이 사이트를 검색하십시오) 2 . 로딩 행렬 의 직교 회전 후 , 요인 분산이 변경되지만, 요인은 상관되지 않은 상태로 유지되며 가변적 인 커뮤니티는 유지됩니다.2

    에서 경사 회전 요소는 그 명확한 "단순한 구조"를 생산한다면 자신의 uncorrelatedness을 잃을 수 있습니다. 그러나 상관 요인에 대한 해석은 더 어려운 기술입니다. 한 요인에서 의미를 도출하여 서로 관련된 다른 요인의 의미를 오염시키지 않기 때문입니다. 즉, 요인을 하나씩 해석하지 말고 병행하여 해석해야한다는 것을 의미합니다. 비스듬한 회전은 패턴 행렬 와 구조 행렬 에스 대신에 하나의 행렬 대신 두 개의 행렬의 하중을 남깁니다 . ( 에스=기음 , 여기서 기음 는 요인들 사이의 상관 행렬이며; 기음='여기서 는 경사 회전의 행렬입니다. 에스=에이 , 여기서 에이 는 회전 전의 로딩 행렬입니다.) 패턴 행렬은 요인이 변수를 예측하는 회귀 가중치 행렬이며, 구조 행렬은 상관 관계입니다. 요인과 변수 간의 공분산). 대부분의 경우 우리 이러한 계수가 변수에 대한 요인의 고유 한 개별 투자를 나타 내기 때문에 패턴 로딩으로 요인을 해석 합니다. 비스듬한 회전은 가변적 인 커뮤니티를 유지하지만, 커뮤니티는 더 이상 또는 S 의 행 제곱의 합과 같지 않습니다.에스. 또한, 요인이 서로 관련되어 있기 때문에 분산이 부분적으로 중첩됩니다 3 .

    물론 직교 및 비스듬한 회전 모두 계산하려는 요소 / 구성 요소 점수에 영향을줍니다 (이 사이트에서 "요소 점수"를 검색하십시오). 실제로 회전 은 추출 직후에 얻은 요소 이외의 다른 요소를 제공합니다 4 . 변수와 상관 관계에 대한 예측 능력을 상속 받지만 사용자와는 다른 의미를 갖습니다. 회전 후에는 "이 요소가 그 요소보다 더 중요합니다"라고 말하지 않을 수도 있습니다. PCA와 달리 FA에서는 솔직히 말해서 추출 후에도 거의 말하지 않을 수 있습니다. 이미 "중요"한 것으로 모델링되었습니다.4

  3. 선택 . 직교 및 경사 회전에는 여러 가지 형태가 있습니다. 왜? 첫째, "간단한 구조"라는 개념은 공통적이지 않으며 다소 다르게 공식화 될 수 있기 때문입니다. 예를 들어, VARIMAX - 가장 인기 직교 방법 - 각 요소의 부하의 제곱 값 사이의 분산을 최대화하기 위해 시도를; 때때로 사용되는 직교 방법 quartimax 는 변수를 설명하는 데 필요한 요소 수를 최소화하고 종종 "일반 요소"를 생성합니다. 둘째, 다른 회전은 단순한 구조를 제외하고 다른 측면 목표를 목표로합니다. 이 복잡한 주제에 대한 자세한 내용은 다루지 않겠지 만 직접 읽어 보시기 바랍니다.

    직교 또는 비스듬한 회전을 선호해야합니까? 직교 인자는 해석하기 쉽고 전체 요인 모델은 통계적으로 더 간단합니다 (직교 예측자는 물론). 그러나 당신은 당신이 발견하고자하는 잠재적 특성에 직교성 을 부과합니다 . 그들이 공부하는 분야에서 서로 관련이 없어야한다고 확신합니까? 그들이 아닌 경우 어떻게? 비스듬한 회전 방법 55(각각 자신의 성향을 가지지 만) 요인들이 서로 관련되도록 허용하지만 강제하는 것은 아니며 덜 제한적입니다. 비스듬한 회전이 요인과 약한 상관 관계가 있음을 보여주는 경우 "실제로"그렇게 확신 할 수 있으며 양심이 좋은 직교 회전으로 전환 할 수 있습니다. 리콜 요인이 있음 - 요소, 다른 한편으로는, 매우 상관 관계가있는 경우, 당신이, 심리학 또는에서 인벤토리를 개발하고 특히, 개념적으로 별개의 잠재적 특성에 대한 (부 자연스러운 모양 입니다 자체의 단 변량 특성이 아닌 배치 현상)을 줄이고 더 적은 수의 요인을 추출하거나 소위 2 차 요인을 추출하기 위해 경사 소스를 배치 소스로 사용하는 것이 좋습니다.


1 Thurstone 앞으로 간단한 구조의 다섯 개 이상적인 조건을 가져왔다. 가장 중요한 세 가지는 다음과 같습니다. (1) 각 변수에는 0에 가까운로드가 하나 이상 있어야합니다. (2) 각 인자는 최소m 개의변수에대해 0에 가까운 하중을 가져야합니다 (m은 인자 수임). (3) 각 요인 쌍에 대해, 적어도하나는 0에 가까운 하중을 가지고, 다른 하나는 0에 충분히 가까운m 개의변수가 있습니다. 결과적으로 각 요인 쌍에 대해 하중 그림은 이상적으로 다음과 같아야합니다.

여기에 이미지 설명을 입력하십시오

이것은 순전히 탐구 적 FA를위한 것이며, 설문지를 개발하기 위해 FA를 수행하고 재실행하는 경우, 두 가지 요소 만있는 경우 결국 파란색 점을 제외한 모든 점을 삭제하려고합니다. 요인이 두 개 이상인 경우 다른 요인의 적재 그림에 대해 빨간색 점이 파란색이되기를 원할 것입니다.


2

여기에 이미지 설명을 입력하십시오


에스에스에이1아르 자형나는2기음1


4


5(보통) 또는 그것없이. 정규화는 회전시 모든 변수를 동일하게 중요하게 만듭니다.


더 읽을 수있는 몇 가지 스레드 :

요인을 전혀 돌리지 않는 이유가있을 수 있습니까?

비스듬한 회전 후 해석해야 할 행렬-패턴 또는 구조?

요인 회전 기법 (varimax 등)의 이름은 무엇을 의미합니까?

구성 요소가 회전 된 PCA가 여전히 PCA입니까? 아니면 요인 분석입니까?


1
+1. 이 질문을 보았으므로 답변에 도움이되기를 바랍니다. 그건 그렇고, 나는 이전에 그러한 질문이 제기되지 않았다는 사실에 놀랐습니다 (적어도 분명한 형태는 아닙니다).
amoeba는 Reinstate Monica가

+1. 답장을 보내 주셔서 감사합니다! 1) 요인 분석 및 PCA를 개별적으로 이해하지만 "인자 분석 기법으로서의 PCA"는 무엇을 의미합니까? PCA와 FA는 2 개의 분리 된 객관적인 권리를 충족시키기 위해 2 개의 다른 것들입니까? 이것은 PCA 구성 요소가 복잡한 구조를 가질 때 회전을 사용하여 단순화 할 수 없다는 것을 의미합니까?
GeorgeOfTheRF

2) "Varimax는 각 요인의 하중 중 분산을 최대화하려고합니다"하중 간의 분산을 최대화하면 어떤 이점이 있습니까?
GeorgeOfTheRF

귀하의 의견에서 (1) : 예, 두 가지 분석 방법이 다릅니다. 그러나 사람들은 때때로 FA의 목적으로 PCA를 사용합니다. 내 답변 과 관련 스레드 전체를 참조하십시오 . PCA에서 요인의 회전을 FA에서와 동일하게 그라우트에서 정확하게 사용할 수 있습니다. 회전과 관련하여 차이는 없습니다.
ttnphns

귀하의 의견 (2). Varimax는 하중의 절대 크기의 분산을 최대화합니다. 결과적으로 각 요인에 대한 요인 로딩은 (절대적으로) 크고 작은 '분할'됩니다. Quartimax는 각 변수가 하나의 요소에 의해서만 많이로드되도록 노력합니다.
ttnphns
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.