PCA 후 경사 회전 사용시


9

SAS, SPSS 및 R과 같은 여러 통계 패키지를 사용하면 PCA에 따라 일종의 요인 회전을 수행 할 수 있습니다.

  1. PCA 후에 회전이 필요한 이유는 무엇입니까?
  2. PCA의 목표가 직교 치수를 생성한다는 점에서 PCA 후에 경사 회전을 적용하는 이유는 무엇입니까?

PCA가 편향된 결과를 제공하기 때문에 PCA 후 요소 회전의 필요성을 설명하는 질문을했습니다. stats.stackexchange.com/questions/6575/…
mbaitoff

답변:


8

PCA에 대해 다른 의견이나 견해가 있다고 생각하지만, 기본적으로 우리는 종종 그것을 축소 기술 로 생각 합니다. 데이터가 필요할 때) 또는 잠재 요인 을 구성하는 방법또는 개인간 분산의 상당 부분을 설명하는 차원 (여기서, "개인"은 데이터가 수집되는 통계 단위를 나타내며 국가, 사람 등일 수 있음). 두 경우 모두, 두 주성분 사이의 직교 구속 조건에 따라 최대 주 분산 (주축에 투영 된 경우)을 설명하는 원래 변수의 선형 조합을 구성합니다. 이제 설명 된 것은 순전히 대수 또는 수학적이며, 어떤 유형의 측정 오류를 설명하기 위해 오류 항을 포함하는 요인 분석 전통에서 수행 된 것과는 반대로 (생성) 모델로 생각하지 않습니다. . 나는 또한 R을 사용하여 적용되는 심리 측정법 에 대한 그의 다음 핸드북에서 William Revelle의 소개를 좋아한다 (6 장) 상관 관계 행렬의 구조를 분석하려면

첫 번째 [접근법, PCA]는 각 구성 요소가 변수의 가중 선형 합인 구성 요소의 곱으로 상관 관계 행렬을 근사화하는 모델이며, 두 번째 모델 [인자 분석]은 두 요인의 곱이지만이 요인은 변수의 결과가 아니라 원인으로 나타납니다.

다시 말해, PCA에서는 각 구성 요소 (인자)를 변수의 선형 조합으로 표현하는 반면, FA에서는 요인의 선형 조합으로 표현되는 변수입니다. 두 방법 모두 일반적으로 상당히 유사한 결과를 산출 할 것임을 잘 알고 있습니다 (특히 Harman, 1976 또는 Catell, 1978 참조). 고려한 저자에 따라 2에서 10 사이입니다!). 이는 FA에서와 같이 상관 행렬에서 대각선을 추정하여 이러한 요소를 커뮤니티라고하며 오류 분산이 요인 행렬에서 제거되기 때문입니다. 이것이 PCA가 지난 세기에 개발 된 FA 대신 잠재적 요인이나 심리적 구성물을 발견하는 방법으로 종종 사용되는 이유입니다. 그러나 이런 식으로 진행하면서 결과 요소 구조 (또는 소위 패턴 매트릭스)를 더 쉽게 해석하려고합니다. 그리고 팩토리얼 축을 회전시키는 유용한 트릭을 통해 특정 팩터에 대한 변수의 로딩을 최대화하거나 "간단한 구조"에 도달합니다. 직교 회전 (예 : VARIMAX)을 사용하여 요인의 독립성을 유지합니다. 비스듬한 회전 (예 : OBLIMIN, PROMAX)을 사용하면이를 끊고 계수를 서로 연관시킬 수 있습니다. 이것은 문헌에서 크게 논의되어 왔으며 일부 저자 (심리학자가 아니라 1960 년대 초의 통계 학자)를 이끌었습니다.

그러나 요점은 로테이션 방법은 원래 FA 접근법의 맥락에서 개발되었으며 현재 PCA와 함께 일상적으로 사용되고 있다는 것입니다. 나는 이것이 주성분의 알고리즘 계산과 모순되지 않는다고 생각한다. 일단 요인 공간의 해석이 상관 관계가 있다면 (사위 회전에 의해) 요인 공간의 해석이 덜 명확하다는 것을 명심한다면, 원하는 방식으로 요인 축을 회전시킬 수있다.

PCA는 새로운 설문지를 개발할 때 일상적으로 사용되지만, 측정 오류를 고려하고 관계를 자체적으로 연구 할 수있는 의미있는 요소를 추출하려고 시도하기 때문에 FA가이 경우에 더 나은 접근 방법 일 것입니다 (예 : 결과 패턴을 제외). 행렬, 우리는 2 차 요인 모델을 얻습니다). 그러나 PCA는 또한 이미 검증 된 것의 계승 구조를 확인하는 데 사용됩니다. 연구자들은 FA와 PCA에 대해 실제로 중요하지 않다고 말합니다. 5 개의 차원을 다루는 60 개 항목 설문지를 평가하도록 요청받은 500 명의 대표 피험자 ( NEO-FFI의 경우)이 경우 우리는 생성 또는 개념적 모델을 식별하는 데 크게 관심이 없기 때문에 정확하다고 생각합니다 ( "대표"라는 용어는 여기에서 측정 불일치 문제를 완화하는 데 사용됩니다 ).

이제 회전 방법의 선택과 일부 저자가 직교 회전의 엄격한 사용에 반대하는 이유에 대해 다음 질문 FA 에 대한 응답으로 Paul Kline을 인용하고 싶습니다 . 기준” ,

(...) 현실 세계에서 중요한 행동 결정자로서 요소가 서로 관련이 있다고 생각하는 것은 무리가 없습니다. -P. Kline, 지능. Psychometric View , 1991, p. 19

따라서 연구의 목적에 따라 (상관 상관 행렬의 주요 패턴을 강조하고 싶 거나 그러한 상관 관계 행렬을 관찰하게 할 수있는 기본 메커니즘에 대한 합리적인 해석을 제공하려고 노력 한다고 결론을 내릴 것 입니다. )의 경우 가장 적합한 방법을 선택해야합니다. 이는 선형 조합의 구성과 관련이 없으며 결과 요인 공간을 해석하려는 방식 일뿐입니다.

참고 문헌

  1. 하만, HH (1976). 현대적 요인 분석 . 시카고 대학교 시카고 프레스.
  2. Cattell, RB (1978). 요인 분석의 과학적 사용 . 뉴욕, 플레 넘.
  3. 클라인, P. (1991). 지성. 심리 측정보기 . Routledge.

4

직교 치수의 문제점은 구성 요소를 해석 할 수 없다는 것입니다. 따라서, 비스듬한 회전 (즉, 비 직교 치수)은 기술적으로 덜 만족하지만, 때때로 이러한 회전은 결과적인 구성 요소의 해석 성을 향상시킨다.


4

기본 포인트

  • 회전을 통해 구성 요소를보다 명확하게 해석 할 수 있습니다
  • 경사 회전은 종종 더 이론적 인 의미가 있습니다. 즉, 관찰 된 변수는 더 적은 수의 상관 된 구성 요소로 설명 될 수 있습니다.

  • 10은 측정 언어 및 측정 공간 능력으로 모든 측정 능력을 테스트합니다. 모든 테스트는 서로 관련이 있지만 구두 또는 공간 테스트 내에서 상호 상관은 테스트 유형 전체보다 큽니다. 포용 적 PCA에는 구두 및 공간의 두 가지 상관 구성 요소가 포함될 수 있습니다. 이론과 연구에 따르면이 두 능력은 서로 관련이 있습니다. 따라서 비스듬한 회전이 이론적으로 의미가 있습니다.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.