이것은 분명히 정식 질문이므로 아직 여기에 언급되지 않았습니다.
Rdφ:Rp→Hdd(x,y)=∥φ(x)−φ(y)∥Hφ의 K ( X , Y ) = ⟨ φ ( X ) , φ ( Y ) ⟩ H{φ(xi)}. 많은 경우에, 우리는 맵을 명시 적으로 계산할 수 없지만 커널 계산할 수 있습니다 . 모든 거리 측정 항목이이 모델에 적합하지는 않지만 많은 모델이 적합하며 문자열, 그래프, 이미지, 확률 분포 등에 정의 된 기능이 있습니다.φk(x,y)=⟨φ(x),φ(y)⟩H
이 상황에서 표준 (Lloyd 's) k- 평균 알고리즘에서 쉽게 점을 클러스터에 할당 할 수 있지만 클러스터 중심을 암시 적으로 나타냅니다 (힐버트 공간에서 입력 포인트의 선형 조합으로). 입력 공간에서 최상의 표현을 찾으려면 Fréchet mean을 찾아야합니다 . 이는 꽤 비쌉니다. 따라서 커널을 사용하여 클러스터 할당을 쉽게 얻을 수 있으며 수단을 얻기가 더 어렵습니다.
다음 백서에서는이 알고리즘에 대해 설명하고 스펙트럼 클러스터링과 관련이 있습니다.
I. Dhillon, Y. Guan 및 B. Kulis. 커널 k- 평균, 스펙트럼 클러스터링 및 정규화 된 컷. KDD 2005.