커널 밀도에 따라 포인트를 클러스터링하는 방법은 무엇입니까?


10

상용 토지 사용을 나타내는 36k 포인트의 큰 데이터 세트가 있으며 각각 평방 피트를 포함하는 필드가 있습니다. 이 데이터 세트에 대한 커널 밀도 분석을 실행하여 전체 대도시 지역에 대한 상용 제곱 푸티 지의 밀도를 보여주는 래스터를 생성했습니다. 이 래스터를 로컬 최대 점에 해당하는 영역으로 나눠야합니다.이를 "센터"라고합니다. 센터의 위치를 ​​이미 결정했으며 이제 두 가지 중 하나를 수행해야합니다.

  • "메도 이드 주변 분할"과 같은 포인트 클러스터링 도구를 사용하여 식별 한 중심 주변의 포인트를 클러스터로 그룹화하십시오. 이 방법의 문제점은 계산적으로 강렬하다는 것입니다. 심지어 비 유사성 매트릭스를 사용하여 포인트를 크기별로 가중치를 부여하려고하면 더욱 그렇습니다.

  • 어떻게 든 커널 밀도 래스터 (대략 지형 래스터와 유사한)를 각 중심 주위의 개별 "힐"로 나눕니다. 그러나 나는 이것을하기위한 도구를 생각할 수 없다.

이 문제는 잠시 동안 괴로워했으며 R에서 클러스터링 방법을 수행 할 수 있기를 희망했지만 시간이 많이 걸리고 시간이 부족합니다. 밀도 래스터를 강도 영역으로 나누거나 큰 데이터 세트를 빠르게 클러스터링하는 간단한 방법을 아는 사람이 있습니까?


1
이 질문은 밀접하게 관련되어 있습니다 : stats.stackexchange.com/questions/13995/…
whuber

1
또한 나에 의해 게시되었습니다.
패트릭

그것은 패트릭에게 1
점일

답변:


6

밀접하게 관련된 게시물에 대한 토론 은 간단하고 효과적인 해결책을 밝혀 냈습니다 . 언덕은 싱크대이며 유역 경계는 그리드를 그 싱크대로 분할합니다.


이 솔루션은 간단하고 빠르며 정확히 내가 찾던 것입니다. 감사.
패트릭

3

가장 간단한 대답은 임계 값을 사용하여 임계 값 아래로 떨어지는 영역을 마스킹하는 것입니다. 이것은 당신의 중심을 둘러싼 뚜렷한 지역을 제공해야합니다. 그런 다음 해당 영역을 모양으로 변환 할 수 있어야합니다.

공간 통계 도구 : 래스터 데이터에 대한 군집 분석도 비슷한 문제에 대한 유용한 토론을 찾을 수 있습니다 .


그렇습니다, 그것은 매우 관련된 토론입니다! 나는 당신의 석사 논문을 읽고 있으며 몇 가지 방법을 시도 할 것입니다.
Patrick

2
센터를 바로 인접한 다른 센터와 구별하려고 시도하기 때문에 임계 값을 사용하면 아마 작동하지 않을 것입니다. 도시 중심에서, 둘 사이의 경계는 밀도가 매우 높지만, 교외 프린지에서는 밀도가 매우 낮습니다. 그러나 나는 이차 미분을 사용하는 것이 효과적이기를 희망합니다.
패트릭

3

나는 당신이 당신의 초기 문제로 돌아 가야한다고 생각합니다 : 전체 대도시 지역에서 상업 광장 영상의 클러스터를 찾으십시오.

나는 당신의 포인트가 평방 피트의 상업적 가치를 가진 소포의 중심이라고 가정합니까? 각 소포마다 총 평방 피트의 폴리곤 레이어를 가질 수 있다고 가정합니까? 그것은 당신에게 각각 정사각형 푸티 지와 정사각형 푸티 지에 대한 케이스 세트 (중심)와 모집단 (소포 다각형)을 제공합니다.

SatScan http://www.satscan.org/를 방문 하여 공간 전용 Poisson- 분산 모델을 실행하면 상용 정사각형 영상 클러스터가 매우 빠른 순서로 생성됩니다. (건물 공간의 평방 피트가 아닌 토지의 평방 피트를 인구로도 사용할 수 있습니다. 더 나은 인구가 될 수도 있습니다.)


점은 중심점 인 것이 맞습니다. 그러나 불행히도 데이터 세트는 각 카운티의 소포 계층에서 다른 사람에 의해 컴파일되어 점으로 만 배포되었습니다. 그러나 SatScan은 매우 유용한 소프트웨어처럼 보이므로 다른 응용 프로그램에 대해서는 염두에 두지 않을 것입니다.
패트릭
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.