클러스터링에 대한 매우 기본적인 질문이 있습니다. 중심이있는 k 개의 군집을 찾은 후 군집화 한 데이터 요소의 클래스를 해석하는 방법 (각 군집에 의미있는 등급 레이블 지정)은 어떻게합니까? 발견 된 클러스터의 유효성 검사에 대해 이야기하고 있지 않습니다.
레이블이 지정된 작은 데이터 포인트 세트를 수행하고 레이블이 지정된 포인트가 속하는 클러스터를 계산하고 각 클러스터가 수신하는 포인트의 유형 및 수를 기반으로 레이블을 결정할 수 있습니까? 이것은 명백한 것처럼 보이지만 이런 식으로 클러스터에 레이블을 할당하는 것이 얼마나 표준인지 모르겠습니다.
명확히하기 위해 레이블을 사용하지 않는 클러스터되지 않은 클러스터링을 먼저 수행하여 클러스터를 먼저 찾고 싶습니다. 그런 다음 클러스터를 찾은 후 몇 가지 예제 데이터 포인트의 속성을 기반으로 클러스터에 의미있는 클래스 레이블을 지정하려고합니다.