@gung은 거리 매트릭스에서 데이터 를 생성하기 위한 예비 도구 로 다차원 스케일링 (MDS)을 제안하는 절대적으로 정확합니다 points X dimensions
. 스트로크를 몇 개만 추가하겠습니다. K-수단 클러스터링은 의미 유클리드 거리를 . MDS는 치수 단위 좌표를 제공하여 유클리드 거리를 보장합니다. 2D 또는 3D로 데이터를 맵핑하지 않고 데이터 재구성 오류를 최소화하는 것이 목표이므로 메트릭 MDS를 사용하고 가능한 한 많은 차원을 요청해야합니다.
MDS 소프트웨어가 없지만 고유 값 분해 또는 특이 값 분해와 같은 행렬 함수가있는 경우 어떻게해야합니까? 그런 다음 간단한 메트릭 MDS를 직접 수행 할 수 있습니다. 주 좌표 분석 (PCoA)이라고도하는 Torgerson MDS. 그것은 약간 "꼬인"주요 구성 요소 분석에 해당합니다. 비록 간단하지만 여기서는 설명하지 않습니다. 여러 곳에서 읽을 수 있습니다 (예 : here) .
마지막으로 PCoA 또는 다른 메트릭 MDS를 수행하는 함수를 호출하거나 쓰지 않고도 "거리 매트릭스 입력에 대한 K- 평균"을 직접 프로그래밍 할 수 있습니다 . 우리는 (a) 중심으로부터의 제곱 편차 의 합이 페어 단위 제곱 유클리드 거리 의 합을 포인트 수로 나눈 것과 같다 ; (b) 거리 행렬 에서 군집 중심 간의 거리를 계산하는 방법을 알고 있어야합니다 . (c) 우리 는 K- 평균에서 제곱합 이 어떻게 관련되는지 알고 있습니다. 모두 함께 복잡한 알고리즘이 아닌 간단하고 원하는 알고리즘을 작성합니다. K-means는 유클리드 거리 / 유클리드 공간만을위한 것임을 기억해야합니다. 비 유클리드 거리에는 K-medoid 또는 기타 방법을 사용하십시오.
비슷한 질문 입니다.