입력 매개 변수 (클러스터 수 )가있는 클러스터링 알고리즘 (k가 아닌 )이 있습니다. 클러스터링을 수행 한 후이 클러스터링의 품질을 정량적으로 측정하고 싶습니다. 클러스터링 알고리즘에는 하나의 중요한 속성이 있습니다. 들면 I 피드 경우 I 함유 한 클러스터 얻을 결과,이 알고리즘에 간의 현저한 차이없이 데이터 포인트를 데이터 요소와 함께 하나 개의 클러스터 데이터 포인트. 분명히 이것은 내가 원하는 것이 아닙니다. 따라서이 클러스터링의 합리성을 추정하기 위해이 품질 측정 값을 계산하려고합니다. 이상적으로 다른 대해이 측정 값을 비교할 수 있습니다 . 범위에서 클러스터링을 실행합니다.최고 품질의 제품을 선택하십시오. 이러한 품질 측정은 어떻게 계산합니까?
최신 정보:
다음은 이 나쁜 클러스터링 인 경우의 예입니다. 정삼각형을 형성하는 평면에 3 개의 점이 있다고 가정합니다. 이 지점을 2 개의 클러스터로 나누는 것이 1 또는 3 개의 클러스터로 나누는 것보다 훨씬 나쁩니다.