R을 사용한 이분법 데이터의 요인 분석을위한 권장 절차


10

이분법 변수 (0 = 예, 1 = 아니오)로 구성된 데이터 집합에 대해 요인 분석을 실행해야하며 올바른 방향에 있는지 알 수 없습니다.

를 사용하여 tetrachoric()내가 실행하는 상관 행렬을 만듭니다 fa(data,factors=1). 결과는 MixFactor를 사용할 때받은 결과와 거의 비슷 하지만 동일하지는 않습니다.

  1. 괜찮습니까, 아니면 다른 절차를 추천 하시겠습니까?
  2. fa()작동하고 factanal()오류가 발생합니까? ( Fehler in solve.default(cv) : System ist für den Rechner singulär: reziproke Konditionszahl = 4.22612e-18)

1
나는 (독일어?) 말하지 않지만 오류는 테트라 코릭 행렬이 단수 (비가역)이기 때문에 발생합니다. 좋은 크기의 샘플을 사용하더라도 일부 다항식 상관 행렬 추정치는 적절한 상관 행렬이되지 않을 수 있습니다. 내 직감은 fa ()가 주요 구성 요소를 사용하고 factanal ()이 최대 가능성 FA를 수행하고 있지만 fa ()에 대한 설명서에서 명확하지 않습니다.
JMS

@cada 품목 / 대상은 몇 개입니까? 그리고 MixFactor에서 어떤 방법이 구현됩니까?
chl

1
@cada 왜 요인 분석을 실행하고 있습니까? 참여자 능력을 평가하려는 경우 IRT가 더 나은 접근 방법 일 수 있습니다. fa 대 factanal의 경우 fa는 기본적으로 최소 잔차를 사용하고 factanal은 ML 방법을 사용합니다.
richiemorrisroe

@chl : 너무 적은! 방금 조사를 시작했고 지금까지 45 명의 과목이 있습니다. 나는 그 순간에 새로운 데이터를 수집 할 수
없어서

1
@cada 45 개의 주제를 가진 CFA는 초현실적입니다. :-) 나중에 내 생각을 추가하려고 노력할 것입니다.
chl

답변:


12

요약하자면, n = 45 명의 피험자에게는 상관 관계 기반 및 다변량 설명 방식이 있습니다. 그러나이 설문지는 일차원 적이어야하므로 항상 좋은 출발이다.

내가 할 것 :

  • 22 개 항목에 대한 쌍별 상관 관계를 계산하십시오. 범위와 중앙값을보고합니다. 이는 관찰 된 항목 응답의 상대적 일관성을 나타냅니다 (0.3보다 큰 상관 관계는 일반적으로 좋은 수렴 유효성을 나타내는 것으로 생각되지만 물론이 추정의 정확도는 샘플 크기에 따라 다릅니다) ; 설문지의 내부 일관성을 연구하는 다른 방법은 Cronbach의 alpha 를 계산하는 것 입니다. n = 45 인 경우 관련 신뢰 구간 (그에 대한 부트 스트랩 사용)이 상대적으로 클 것입니다.
  • 항목들과 합산 된 척도 점수 사이의 계산 포인트-비교 상관 ; 각 항목의 구별 력 (FA에서의 하중과 같은)에 대한 아이디어를 제공합니다. 여기서 0.3보다 큰 값은 각 항목과 해당 척도 간의 만족스러운 관계를 나타냅니다.
  • PCA를 사용하여 상관 매트릭스를 요약하십시오 ( 이분법 적으로 점수가 매겨진 항목의 경우 다중 대응 분석 에서 얻은 것과 동등한 해석을 제공함). 장비가 샘플의 일차원 척도로 작동하는 경우, 지배적 인 변동 축 (첫 번째 고유 값에 의해 반영됨)을 관찰해야합니다.

R을 사용하려면 ltmpsych 패키지 에서 유용한 기능을 찾으십시오 . 더 많은 패키지에 대해서는 CRAN Psychometrics Task View를 찾아보십시오 . 100 명의 피험자가있는 경우 부트 스트랩 신뢰 구간을 사용하여 CFA 또는 SEM 분석을 시도 할 수 있습니다. (물리적 상관 계수의 표준 오차 2 배 이상이어야하므로 항목과 해당 요소간에 유의 한 상관 관계가있는 것으로 간주하려면 하중이 매우 커야합니다.2(1아르 자형2)/()


대단히 감사합니다! 귀하의 답변은 매우 상세하고 정말 도움이됩니다! 감사합니다!
cada

3

이 스레드는 factanal (영어 : "시스템은 계산 상 단수 : 상호 조건 번호")을 사용하여 "시스템은 rechner 단일 시스템 : reziproke Konditionszahl"오류에 대해 Google 위치가 양호하므로 의견을 추가합니다.

상관 행렬이 우선적으로 계산 될 때 (예를 들어, 결 측값을 쌍으로 삭제하기 위해) factanal ()이 행렬이 분석 할 데이터라고 생각하지 않도록하십시오 (https://stat.ethz.ch/pipermail/r- help / 2007-October / 142567.html).

PREVIOUS: matrix = cor(data, use="pairwise.complete.obs")  # For example
WRONG: factanal(matrix, 3, rotation="varimax")
RIGHT: factanal(covmat=matrix, factors=3, rotation="varimax")

BurninLeo

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.