요인 분석에서 요인으로로드 된 항목 (변수)이 2 개 이하인 것이 허용됩니까?


10

SPSS에서 요인 분석을 거친 20 개의 변수 세트가 있습니다. 연구 목적으로 6 가지 요소를 개발해야합니다. SPSS는 8 개의 변수 (20 개 중)가 적은 가중치로로드되었거나 여러 요인에 의해 동일하게로드 된 것을 보여주었습니다. 나머지 12 개의 변수는 6 개의 요소 중 2 개의 쌍으로로드되었습니다. 6 개의 요소는 제가 원했던 것처럼 완벽한 구조입니다. 그러나 지금 나와 함께 일하는 교수 중 한 명이 왜 (또는 어떤 조건에서) 정당성을 찾기를 원합니다. 요인 분석은 요인 당 3 개 이상의 항목이로드 된 결과에 유용한 것으로 알려져 있기 때문에 요인 당 2 개의 항목 유지하는 것이 좋습니다 .

누구 든지이 문제를 해결하는 데 도움이 될 수 있습니까?


품목이 더 높은 계수 로딩을 갖는 경우 단일 품목 계수도 허용됩니다.
Meera Gang

"요소 당 최소 3 개의 항목"은 보증 된 권장 사항입니다. 요인 회전 후 요인에 2 개 또는 1 개의 품목이있는 결과가있는 경우 1) 해당 요인에 의해로드 될 것으로 예상되는 더 많은 변수를 얻거나 2) 분석을 다시 수행하고 더 적은 요인을 추출하거나 3) "인수는 존재한다고 생각하지만 현재는 충분히 지원되지 않기 때문에 해석과 결과에서 제외됩니다." 그러나이 두 가지 권장 사항은 모두 다릅니다.
ttnphns 2012 년

또한 여기에 대한 답변 외에도 stats.stackexchange.com/a/198684/3277(poit 5)에서 "요소 당 최소 3 개의로드 된 항목"이 합리적인 요구 사항 인 이유를 참조하십시오.
ttnphns

답변:


13

요인 당 2 ~ 3 개의 항목은 CFA (확인 FA) 모델의 식별 문제입니다.

간단히하기 위해 각 요인의 분산을 1로 설정하여 모델을 식별한다고 가정합니다. 상관 측정 오류가 없다고 가정합니다.

두 항목이 포함 된 단일 요인 모델에는 두 개의 하중과 두 개의 오차 분산이 추정되지만 = 4 개의 매개 변수가 있지만 분산-공분산 행렬에는 중요하지 않은 항목이 3 개뿐이므로 4 개의 매개 변수를 추정하기에 충분한 정보가 없습니다. 당신이 필요합니다.

3 개의 항목이있는 단일 요인 모델에는 3 개의 하중과 3 개의 오차 분산이 있습니다. 분산-공분산 행렬에는 6 개의 항목이 있으며 신중한 분석 검사를 통해 모형이 정확하게 식별되었음을 알 수 있으며 분산-공분산 행렬 항목의 함수로 모수 추정값을 대수적으로 표현할 수 있습니다. 단일 요인 당 더 많은 항목을 사용하면 모델이 과도하게 식별되어 (매개 변수보다 더 많은 자유도) 일반적으로 사용하기 좋습니다.

하나 이상의 요인으로 CFA 모델은 각 요인 당 3 개 이상의 항목으로 항상 식별됩니다 (간단한 측정 모델이 각 요인에 대해 식별되므로 대략적으로 말하면 각 요인에 대한 예측을 얻고이를 기반으로하는 공분산을 추정 할 수 있습니다). 그러나 각 요인이 모집단의 다른 요인 중 하나와 공분산이 0이 아닌 경우 요인 당 2 개의 항목이있는 CFA가 식별됩니다. (그렇지 않으면 문제의 요인이 시스템에서 벗어나고 두 항목의 단일 요인 모형이 식별되지 않습니다.) 식별 증명은 다소 기술적이며 행렬 대수에 대한 이해가 필요합니다.

Bollen (1989) 은 7 장에서 CFA 모델의 식별 문제에 대해 완전하고 철저하게 논의한다. 244는 구체적으로 3 개 및 2 개 지표 규칙에 관한 것이다.


1
이것은 매우 적절한 대답이었습니다. OP가 탐색 FA (EFA)에 관해 물었다는 것만 (OP를 위해) 언급하고 싶습니다. CFA가 예상하기 때문에 EFA에 "요소 당 3 개 이상의로드 된 항목"이 있어야한다는 것이 논리적입니다. 당신이 당신의 대답에서 그것에 대해 말하지 않았다는 것만.
ttnphns

4

"요소 당 3 개의 항목"기준에 대해 들어 본 적이 없습니다. 나는 그 질문을 뒤집어 교수님에게이 진술에 대한 건전한 참고 자료를 생각해 보라고 요청합니다.

그 외에도 "연구 목적으로 6 가지 요소를 개발해야합니다." 말할 이상한 것입니다.

요인 분석의 기본 목적은 1) (더 큰) 측정 변수의 기초가되는 많은 요인 (종종 심리적 특성)을 알아내는 것입니다. 그런 다음 2) 요인로드에 따라 이러한 요인이 실제로 무엇인지 설명하려고합니다.

6 가지 요소를 "개발"하지 않고 6 가지 요소를 "측정하려고"합니다.

그러나 교차로드 (여러 요인에 의해로드 된 변수)가 존재하는 경우는 종종 해당 요인이 서로 "상관하려고합니다"라는 표시입니다. 기본적으로 모든 것이 현실 세계의 모든 것과 관련이 있다는 것을 알기 때문에 의미가 있습니다. 직교 가변 최대 대신 경사를 사용하여 분석에서이 관찰을 구현하면 많은 교차 하중이 제거되는 경우가 많습니다. IMHO, 이론적으로도 더 견고합니다.

샷을 주면 요인 당 더 많은 항목이 생길 수 있습니다. 그것은 (부분적으로) 문제를 해결할 수도 있습니다.


의견을 보내 주셔서 감사합니다. 제가 사용중인 모델로 설명 할 수있는 6 가지 요인, 교수님이 6 가지 요인 설명에 반대하지는 않지만, 요인 당 2 개 항목 만있는 요인 분석을 사용하는 것이 좋을 때는 설명을 원합니다. . 이것은 여전히 ​​질문입니다.
Mitja

@ pythonforspss.org 사이트에 오신 것을 환영합니다. 여기에 +1 정보가 많이 있습니다. 몇 가지 참고 사항 : 요인 당 적어도 3 개의 변수가 필요하다고 여러 번 들었지만이 규칙의 실질적인 이유가 무엇인지 알지 못합니다. 영어를 더 매끄럽게 만들기 위해 OP의 Q를 편집했습니다. 나는 당신이 사전에 있던 것을 대체하기 위해 당신이 인용하는 문구를 넣었습니다. 이것은 이상적이지 않을 수도 있습니다 (OP가 말하려고하는 것을 번역하는 방법을 잘 모르겠습니다). 그렇다면 Mitja가 아닌 내 잘못입니다. 영어는 많은 사용자의 모국어가 아닙니다.
gung-모니 티 복원

요인 당 세 항목은 상식이며 검토 단계에서 문제를 일으키는 경향이 있습니다 (공통 신념이므로). 즉, 커뮤니티가 높으면 (> 0.7) 문제가 없을 것입니다.
richiemorrisroe

내 커뮤니티는 0.5 이상입니다 ...
Mitja

factors are "trying to correlate" with each other신비한 공식입니다. 요소가 회전 (모델) 방식에 따라 요소가 상관되거나 상관되지 않습니다. 커뮤니티가 높은 변수를 가진 직교 요소를 사용하면 상당히 높은 "크로스 로딩"이 가능합니다.
ttnphns

1

나는 지금 같은 문제가 있습니다. 다음은 요인 당 최소 3 개의 항목을 사용하도록 권장하는 기사입니다. 그러나 예외적 인 경우 요인 당 항목에 사용할 수 있습니다 (p.60). http://www.sajip.co.za/index.php/sajip/article/download/168/165 웹 기반 실험에는 플레이어의 정보를 제공하는 변수가 두 개뿐이므로 제 경우는 예외적 인 것 같습니다 전략과 전략의 힘. 일부 요인에 대해 2 가지 품목의 사용을 합법화하는 것도 도움이 될 수 있습니다.


1
이 웹 사이트에는 요인 규칙 당 최소 3 개의 변수를 지원하는 수많은 참조가 있습니다. encorewiki.org/display/~nzhao/…
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.