두 요소 ei, ej ∈ E 사이 에 요소 E 와 유사성 ( 거리가 아닌 ) 함수 sim (ei, ej) 가 있다고 가정합니다 .
sim을 사용하여 E 의 요소를 어떻게 효율적으로 클러스터링 할 수 있습니까?
k는 예를 들면, 소정의 요구 -means k는 캐노피 클러스터링 개의 임계치를 필요로한다. 사전 정의 된 매개 변수를 원하지 않으면 어떻게합니까?
참고, 그 시뮬레이션은 neccessarily 메트릭 아니다 (즉, 삼각 부등식하거나 보유하지 않을 수있다). 또한 클러스터가 분리되어 있는지 여부는 중요하지 않습니다 ( E의 파티션 ).
1-sim(ei, ej) = Distance
. 거리 측정법을 사용하면 계층 적 군집화를 적용 할 수 있습니다. 루트에서 내려 가면 특정 문제에 어떤 수준의 세분성 클러스터가 적합한 지 알 수 있습니다.