요인 분석에서 최상의 요인 추출 방법


29

SPSS는 여러 가지 요인 추출 방법을 제공합니다.

  1. 주요 구성 요소 (요인 분석이 아님)
  2. 비가 중 최소 제곱
  3. 일반화 된 최소 제곱
  4. 최대 가능성
  5. 주축
  6. 알파 팩토링
  7. 이미지 팩토링

요인 분석 (주요 성분 분석, PCA)이 아닌 첫 번째 방법을 무시합니다.이 중 어떤 방법이 가장 적합합니까? 다른 방법의 상대적인 장점은 무엇입니까? 그리고 기본적으로 어떤 것을 사용할 것인지 어떻게 선택합니까?

추가 질문 : 6 가지 방법 모두에서 비슷한 결과를 얻어야합니까?


흠, 내 첫 충동 : 이것에 위키 백과 항목이 없습니까? 그렇지 않다면 – 반드시 존재해야합니다.
Gottfried Helms

4
예, Wikipedia 기사가 있습니다. 데이터가 정상이면 MLE을 사용하고 그렇지 않으면 PAF를 사용합니다. 장점이나 다른 옵션에 대해서는별로 언급하지 않습니다. 어쨌든, 나는이 사이트의 회원들이 실제 경험을 바탕으로이 문제에 대해 어떻게 생각하는지 알게되어 기쁩니다.
Placidia

답변:


41

짧게 만들려면 마지막 두 가지 방법은 각각 매우 특별 하며 숫자 2-5와 다릅니다. 그것들을 모두 공통 요인 분석 이라고 하며 실제로 대안으로 간주됩니다. 대부분의 경우 비슷한 결과가 나타납니다. 그것들은 고전 요인 모델 , 공통 요인 + 고유 요인 모델 을 나타 내기 때문에 "공통" 입니다. 설문 분석 / 검증에 일반적으로 사용되는 모델입니다.

PIF (Principal Axis) , 일명 반복이있는 Principal Factor는 가장 오래되었지만 가장 인기있는 방법입니다. 커뮤니티가 1 또는 분산 대신 대각선에 서있는 매트릭스에 대한 반복적 인 PCA 적용입니다. 따라서 다음 번 반복 할 때마다 커뮤니티가 수렴 될 때까지 더 세분화됩니다. 그렇게함으로써 쌍별 상관 관계가 아닌 분산을 설명하는 방법은 결국 상관 관계를 설명합니다. 주축 방법은 PCA와 같이 상관 관계뿐만 아니라 공분산 및 기타를 분석 할 수 있다는 장점이 있습니다.1SSCP 측정 (원시 sscp, 코사인). 나머지 세 가지 방법은 상관 관계 만 처리합니다 [SPSS; 공분산은 다른 구현에서 분석 될 수있다]. 이 방법은 커뮤니티의 시작 추정 품질에 따라 달라집니다 (그리고 단점입니다). 일반적으로 제곱 된 다중 상관 / 공분산이 시작 값으로 사용되지만 다른 추정치 (이전 연구에서 얻은 추정치 포함)를 선호 할 수도 있습니다. 읽어 보시기 바랍니다 이상. PCA 계산에 주석을 달고 비교 한 주축 인수 분해 계산의 예를 보려면 여기를 참조 하십시오 .

정규 또는 비가 중 최소 제곱 (ULS) 은 입력 상관 행렬과 재생산 된 (인자에 의해) 상관 행렬 사이의 잔차를 최소화하는 것을 목표로하는 알고리즘입니다 (공동 성과 고유성의 합이 1을 복원하는 것을 목표로하는 대각선 요소) . 이것은 FA 직무입니다 . ULS 방법은 요인의 수가 순위보다 작을 경우 단수 및 양의 반정의 상관 행렬과 함께 작동 할 수 있습니다. 이론적으로 FA가 적절하다면 문제가 될 수 있습니다.2

일반화 또는 가중 최소 제곱 (GLS) 은 이전의 수정입니다. 잔차를 최소화 할 때 상관 계수는 차등 적으로 가중치가 적용됩니다. (현재 반복에서) 고유성이 높은 변수 간의 상관 관계는 가중치 줄어 듭니다 . 요인이 고유 변수 (즉 요인에 의해 약한 요인)에 매우 일반적인 변수 (즉 요인에 의해 강하게 유발 된 요인) 보다 더 적합하도록하려면이 방법을 사용하십시오 . 이 소원은 특히 설문지 작성 과정에서 드물지 않으며 (적어도 그렇게 생각합니다),이 속성은 유리합니다 .44

최대 가능성 (ML)다변량 정규 분포를 가진 모집단에서 데이터 (상관 관계)를 가져 왔다고 가정하고 (다른 방법은 그러한 가정을하지 않음) 상관 계수의 잔차는 일반적으로 0 주위에 분포해야합니다. 상관의 처리는 일반화 된 최소 제곱 법과 같은 방식으로 단일성에 의해 가중됩니다. 다른 방법은 샘플을 그대로 분석하지만 ML 방법은 모집단에 대해 약간의 추론을 허용하지만, 많은 적합 지수와 신뢰 구간은 일반적으로 그것과 함께 계산됩니다. (안타깝게도 SPSS에서는 그렇지 않지만 SPSS에 대해 매크로를 작성했지만 그것].

내가 간략하게 설명한 모든 방법은 선형적이고 연속적인 잠재 모델입니다. "선형"은 예를 들어 순위 상관을 분석해서는 안된다는 것을 의미합니다. "연속"은 예를 들어 이진 데이터를 분석해서는 안된다는 것을 의미합니다 (테트라 코릭 상관 관계에 기반한 IRT 또는 FA가 더 적합 할 것입니다).


1아르 자형

22

아르 자형11아르 자형1

4

여기에 이미지 설명을 입력하십시오


더 많은 측면을 추가해야한다고 생각합니다. 우리는 미리 결정된 수의 요인에 요인 솔루션을 맞추기 위해 방법을 사용하는지 또는 데이터에서 요인의 수를 몇 가지 기준 (고유 값, screetest 등)으로 표시할지 여부를 생각합니다. . 내가 이해하는 것처럼 ML은 여러 요인을 미리 지정하고 요인 솔루션을 찾은 경우 카이 제곱 검정도 가능하다면 감각적입니다. PCA는 카이 제곱 테스트가없는 몇 가지 기준을 고려할 때 데이터 속성에 의해 여러 가지 요소가 동적으로 표시되도록합니다. PAF는 두 가지 방식으로 모두 사용할 수 있습니다.
Gottfried Helms

1
@Gottfried, 나는 당신이 그것을 넣는 방식에 오히려 동의하지 않습니다. 모든 FA 방법은 요소의 수는 필요 해요 알려진 : 당신의 모델에 맞게 m 지정합니다. m 을 결정하는 데 도움이되는 다양한 기준을 사용할 수 있지만 이러한 모든 요인은 요인 추출 방법 자체의 일부가 아닙니다. 해당 카이 제곱을 제외하고 GLS 및 ML 방법과 함께 계산됩니다. 또한 PA 방법을 사용하면 사전에 진정한 커뮤니티를 아는 경우 (매우 드물게) 가장 좋은 m 방향으로 안내 할 수 있습니다 . 그러나 어쨌든 추출 알고리즘이 아닌 당신은 m을 결정합니다 .
ttnphns

이제 무엇을 사용해야합니까? 어느 것이 최고입니까?
MrYouMath 2016 년

1
최고는 당신이 가장 좋아하는 것입니다. 필요한 경우 왜 그것이 적합한 지 설명합니다. 어디서나.
ttnphns 2016 년

@ttnphns, 원리가 when to use which있습니까?
kittygirl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.