배경 : 설문 조사에 참여한 수백 명의 참가자에게 선택한 영역에 대한 관심이 어느 정도인지 물었습니다 (1은 "관심이 없음"을 나타내고 5는 "관심이없는"을 나타냄).
그런 다음 PCA를 시도했습니다. 아래 그림은 처음 두 가지 주요 구성 요소에 대한 투영입니다. 색상은 성별에 사용되며 PCA 화살표는 원래 변수 (예 : 관심 분야)입니다.
난 그것을 알아 챘다:
- 점 (응답자)은 두 번째 구성 요소에 의해 상당히 잘 분리되어 있습니다.
- 왼쪽 화살표가 없습니다.
- 일부 화살표는 다른 화살표보다 훨씬 짧습니다.
- 변수는 군집을 만드는 경향이 있지만 관찰은 아닙니다.
- 아래쪽을 가리키는 화살표 (남성)는 주로 남자의 관심사이고 위쪽을 가리키는 화살표는 주로 여자의 관심사 인 것 같습니다.
- 일부 화살표는 아래쪽이나 위쪽을 가리 키지 않습니다.
질문 : 점 (응답자), 색상 (성별) 및 화살표 (변수) 간의 관계를 올바르게 해석하는 방법은 무엇입니까? 이 그림에서 응답자와 그들의 관심사에 대한 다른 결론을 찾을 수 있습니까?