고차 시스템의 차원을 줄이고 바람직하게는 2 차원 또는 1 차원 필드에서 대부분의 공분산을 포착하고 싶습니다. 나는 이것이 주성분 분석을 통해 이루어질 수 있다는 것을 알고 있으며 많은 시나리오에서 PCA를 사용했습니다. 그러나 부울 데이터 유형에는 사용하지 않았 으며이 세트로 PCA를 수행하는 것이 의미가 있는지 궁금했습니다. 예를 들어, 질적이거나 설명적인 척도가 있다고 가정하고 해당 측정 기준이 해당 측정 기준에 유효한 경우 '1'을 지정하고 측정 기준이 아닌 경우 '0'을 할당합니다 (이진 데이터). 예를 들어, 백설 공주에서 일곱 난장이를 비교하려고하는 것처럼 가장하십시오. 우리는 :
Doc, Dopey, Bashful, Grumpy, Sneezy, Sleepy and Happy, 당신은 자질에 따라 그것들을 정리하고 싶었습니다.
예를 들어 Bashful은 유당 불내증이며 A 명예 롤에는 없습니다. 이것은 순전히 가상의 행렬이며 실제 행렬에는 더 많은 설명 열이 있습니다. 제 질문은 개인 간 유사성을 찾는 수단으로이 매트릭스에서 PCA를 수행하는 것이 여전히 적절할까요?
a means of finding the similarity between individuals
. 그러나이 작업은 PCA가 아닌 클러스터 분석을위한 것입니다.