맵 포인트를 고정 된 클러스터 크기로 그룹화 하시겠습니까?


10

나는 약 100 그룹으로 나누고 싶은 655 lat / long 쌍의 데이터 세트를 가지고 있습니다. 그룹은 지리적으로 서로 가까운 5-10 쌍을 가져야합니다. 밀도가 높은 그룹은 더 많은 포인트를 가져야하고, 스파 스 그룹은 더 적은 포인트를 가져야합니다. 예를 들어 도시 그룹은 더 크고 농촌 그룹은 더 작아야합니다.

이런 종류의 그룹화를 수행하는 알고리즘이 확립되어 있습니까? 아니면 처음부터 새로 설계해야합니까?

Google지도 v3 API를 사용 하여이 데이터를 표시하고 있지만 고정 데이터 세트이므로 오프라인 숫자 처리를 수행 할 준비가되었습니다.


4
이와 같이 전문적이고 정교한 분석을 수행하기 위해 GIS의 안락함을 기꺼이 남겨두면 다양한 옵션을 사용할 수 있습니다. 예를 들어, R로 사용 가능한 모든 클러스터링 솔루션을 확인하십시오 . (다른 통계 패키지도 많은 클러스터링 솔루션을 제공합니다.) R이를 사용하는 데 많은 기능이 필요하지 않습니다. 좌표를 읽고, 클러스터링 루틴을 적용하고, 필요한 경우 결과를 쓰는 방법을 배워야합니다. GIS가 후 처리 할 수있는 파일에.
whuber

당신은 크기의 정의에 명시 할 수 있습니까?
raphael 18

답변:


11

k- 평균 군집 알고리즘을 여기서 확인할 수 있습니다 .

데이터 마이닝에서 k- 평균 군집화는 각 관측 값이 가장 가까운 평균을 갖는 군집에 속하는 k 개의 군집으로 n 개의 관측치를 분할하는 것을 목표로하는 군집 분석 방법입니다. 이로 인해 데이터 공간이 Voronoi 셀로 분할됩니다.

kmeans-postgresql 구현은 여기에서 .. 그리고 나는이 주제를 PostGIS로 공간 클러스터링 (Spatial clustering with PostGIS)과 새로 만난다. 여기 에서 ST_MinimumBoundingCircle 함수를 사용하여 @Mike Toews에서 확인할 수있다 ..

미키


kmeans

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.