분리 가능한 데이터에 대한 K- 평균 이외의 클러스터링 공식화


11

실제 데이터는 때때로 자연스러운 수의 클러스터를 갖습니다 (일부 매직 k보다 적은 수의 클러스터로 클러스터하려고하면 클러스터링 비용이 크게 증가합니다). 오늘 저는 Adam Meyerson 박사의 강의에 참석했으며 이러한 유형의 데이터를 "분리 가능한 데이터"라고했습니다.

K- 평균 이외의 데이터에서 자연 분리 성을 활용하는 클러스터링 알고리즘 (근사 또는 휴리스틱)을 사용할 수있는 일부 클러스터링 공식화는 무엇입니까?

답변:


11

이러한 개념을 포착하려는 최근 모델 중 하나 는 Balcan, Blum 및 Gupta '09입니다. 데이터가 어떤 그런 경우 즉 것을 : 데이터 만족 특정 가정 할 때 그들은 다양한 클러스터링 목표에 대한 알고리즘을주고 클러스터링 목적을 위해 -approximation가 ε 최적의 클러스터링에 - 닫기, 그때 그들은 거의을 찾기위한 효율적인 알고리즘을 제공 할 수 있습니다 c 근사값 을 찾는 것이 NP-Hard 인 c 값에 대해서도 최적의 클러스터링 . 이것은 데이터가 어떻게 든 "좋음"또는 "분리 가능"하다는 가정입니다. Lipton은 이것에 대한 멋진 블로그 게시물 을 가지고 있습니다.cϵcc

αα

나는 초기 연구와 초기 관련 개념이 있다고 확신하지만 이것들은 귀하의 질문과 관련된 최근의 이론적 결과입니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.