D P I C J (k)를입력 점 와 중심점 사이의 유클리드 거리를 나타냅니다 . 각 점은 정점을 다른 군집 으로 그룹화하는 가장 가까운 군집 중심에 자신을 할당 합니다.
이 문제는 (이산 된) 클러스터링 문제 로 알려져 있으며 -hard입니다. 그것이에서 감소로 나타낼 수있다 - 완전한 지배 세트 문제점이 존재하는 경우 -approximation 알고리즘의 문제점에 대한 다음 .NP NP ρ ρ < 2 P = NP
최적의 근사 알고리즘은 매우 간단하고 직관적입니다. 먼저 점 선택합니다p ∈ P 임의로 클러스터 중심 의 설정된 에 넣습니다 . 그런 다음 다른 모든 클러스터 센터에서 가능한 한 멀리 떨어진 다음 클러스터 센터를 선택합니다. 따라서 , 우리는 반복 점 발견 거리하는 최대화하고 추가로 . 한 번 우리는 끝났습니다.| C | < k j ∈ P D ( j , C ) C | C | = k
최적의 욕심 많은 알고리즘이 시간에 실행되는 것을 보는 것은 어렵지 않습니다 . 이것은 의문을 제기한다 : 우리는 시간을 달성 할 수 있는가? 우리는 얼마나 더 잘할 수 있습니까?O ( N K )