답변:
기본적으로 k-means가 발견 한 분류의 장점을 측정 한 것입니다. SS는 분명히 Sum of Squares의 약자이므로, "Between"과 "Inin"사이의 이탈의 일반적인 분해입니다. 이상적으로는 내부 응집력과 외부 분리 특성이있는 클러스터링이 필요합니다. 즉 BSS / TSS 비율이 1에 근접해야합니다.
예를 들어, R에서 :
data(iris)
km <- kmeans(iris[,1:4], 3)
BSS / TSS 비율이 88.4 % (0.884)로 적합합니다. 주의해서 사용해야하며 일반적으로이 수를 미리 지정해야하므로 클러스터 수에 대해 WSS를 플로팅하는 것이 좋습니다.