답변:
선형 FA의 입력 데이터 가정 ( FA 모델 의 내부 가정 / 속성 또는 결과 의 적합 품질 확인에 대해서는 여기서 말하지 않습니다 ).
p
상관 된 벡터는 p-dim 공간에 걸쳐서 p의 서로 직교하는 고유 한 구성 요소를 수용해야합니다. 따라서 이론적 인 이유 때문에 특이점 은 없습니다 (따라서 자동으로 말하지 않고 더 좋습니다 ). 하지 않는 것이 완전한 다중 공선는하지만 허용된다; 그러나 대부분의 FA 알고리즘에서 계산 문제를 일으킬 수 있습니다 ( 참조 ).n observations > p variables
n>>p
FA의 ULS / 마이너 방법 은 단일 및 심지어 비 psd 상관 행렬과 함께 작동 할 수 있지만 이론적으로는 이러한 분석이 엄청나게 모호합니다.
Binary data should also be avoided
다른 요인 분석 방법을 사용할 수 binary data
있습니까?
대부분의 경우 요인 분석은 통계 테스트없이 수행됩니다. 회귀, 구조 방정식 모델링 등과 같은 방법보다 훨씬 더 주관적이고 해석 적입니다. 일반적으로 가정과 함께 제공되는 추론 테스트입니다. p 값과 신뢰 구간이 정확하려면 이러한 가정을 충족해야합니다.
이제 요인 수를 선택하는 방법이 최대 우도 방법으로 설정되면 요인 분석에 입력 된 변수에 정규 분포가 있다고 가정합니다.
입력 변수가 0이 아닌 상관 관계를 갖는다는 것은 사실이 아니라면 요인 분석 결과가 (아마도) 쓸모가 없다는 점에서 일종의 가정입니다. 어떤 입력 변수 집합 뒤에 잠재 변수로 요소가 나타나지 않습니다.
"요인 (공통 및 특정) 간의 상관 관계가없고 한 요인의 변수와 다른 요인의 변수 사이의 상관 관계가없는 한, 요인 분석가가 조건이나 근사치 중 하나를 선택하더라도 보편적으로 가정하는 것은 아닙니다. 그것의) 바람직 할 수 있습니다. 후자는 그것이 붙을 때 "간단한 구조"로 알려져 있습니다.
때때로 "가정"으로 취급되는 또 다른 조건이 있습니다. 입력 변수 간의 0 차 (바닐라) 상관 관계가 큰 부분 상관 관계에 의해 늪이되지 않습니다. 간단히 말해, 관계는 일부 페어링에서는 강력하고 다른 페어링에서는 약해야한다는 것입니다. 그렇지 않으면 결과가 "흐리게됩니다". 이는 단순한 구조의 바람직 함과 관련이 있으며 Kaiser-Meyer-Olkin 통계 또는 KMO를 사용하여 실제로 공식적으로 "테스트 된"것은 아닙니다. .8 또는 .9 근처의 KMO 값은 일반적으로 유익한 요인 분석 결과에 매우 유망한 것으로 간주되는 반면 .5 또는 .6 근처의 KMO는 유망하지 않으며 .5 이하의 값은 분석가가 자신의 전략을 다시 생각하게 할 수 있습니다.