다음은 mplus 에서이 작업을 수행 한 경우 도움이되고보다 포괄적 인 답변을 칭찬하는 예입니다.
3 개의 연속 변수가 있고이를 기반으로 클러스터를 식별하려고한다고 가정 해보십시오. 조건부 독립성을 가정하고 (클러스터 멤버쉽이 주어지면 관측 된 변수는 독립적 임) 혼합 모델 (이 경우에는보다 구체적으로 잠재 프로파일 모델)을 다음과 같이 지정합니다.
Model:
%Overall%
v1* v2* v3*; ! Freely estimated variances
[v1 v2 v3]; ! Freely estimated means
매번 다른 수의 클러스터를 지정할 때 마다이 모델을 여러 번 실행하고 가장 좋아하는 솔루션을 선택합니다 (이 작업은 자체적으로 광범위한 주제입니다).
그런 다음 k- 평균을 실행하려면 다음 모델을 지정합니다.
Model:
%Overall%
v1@0 v2@0 v3@0; ! Variances constrained as zero
[v1 v2 v3]; ! Freely estimated means
따라서 클래스 멤버십은 관찰 된 변수의 평균까지의 거리에만 근거합니다. 다른 반응에서 언급했듯이 차이는 그와 관련이 없습니다.
mplus 에서이 작업을 수행하는 좋은 점은 중첩 된 모델이므로 두 방법 간의 분류에서 불일치를 비교할 수있을뿐만 아니라 제약 조건이 더 적합하지 않은지 직접 테스트 할 수 있다는 것입니다. 그런데이 두 모델 모두 EM 알고리즘을 사용하여 추정 할 수 있으므로 그 차이는 실제로 모델에 대한 것입니다.
3 차원 공간에서 생각하면 3은 점을 의미합니다 ... 그리고 그 점을 통과하는 타원체의 세 축은 분산됩니다. 세 가지 분산이 모두 같으면 구를 얻게됩니다.