답변:
ArcGIS (또는 다른 GIS, AFAIK)의 기본 제공 도구는 작업을 올바르게 수행하지 않습니다.
이와 같은 문제에서는 "클러스터링 (clustering)"으로 의미하는 바를 수량화 한 다음 우연한 확률로 측정 된 군집 수준이 생성 될 수 있는지 여부를 평가하기 위해 확률 모델을 배치해야합니다.
진행 방법의 예로 x 유형의 건물과 y 유형 의 가장 가까운 건물 사이의 일반적인 거리를 기준으로 군집을 측정 할 수 있습니다 . 이것은 쉬운 계산입니다. 단순히 두 개의 건물 세트를 별도의 점 레이어로 표현하고 Y와 X의 공간적 결합을 수행하면됩니다. 각 유형 x 건물 에 대해 여전히 하나의 레코드가있는 속성 테이블에 이제 가장 가까운 y 까지의 거리가 포함됩니다 . 평균 거리를 측정 값으로 사용할 수 있습니다.
이것이 우연의 결과 일 수 있는지 테스트하는 것은 까다 롭습니다. 이 설정 중 하나 개 그럴듯한 해석의 이전 존재한다는 것입니다 Y 형 건물의 개발을 장려 X의 상대적으로 가까이에 형 건물을 Y 의. 그렇지 않으면, 우리는 x 형 건물이 다른 건물들도 나타날 수있는 어느 곳에 나 건설 될 수 있다고 가정 할 수 있습니다 . 이것은 다음과 같은 순열 테스트로 이어집니다 . x 유형 건물 이 나타날 수 있는 모든 가능한 위치의 점 레이어를 만듭니다 . 이 층은 x 와 같은 기간 동안 건립 된 지역에있는 모든 건물의 위치가 될 수 있습니다.건물은 ( 물론 x 건물을 포함하여 ) 물론이었습니다. y 층을 공간적으로 결합하여 가장 가까운 y 유형 건물 까지의 거리를 얻습니다 . 나머지 계산은 속성 테이블에서 작동합니다. 지리적 계산이 수행됩니다. 당신이 할 일은 난수 생성기를 반복적으로 사용하여 모든 건물의 간단한 무작위 샘플을 채취하는 것입니다. 각 샘플에는 x 유형 건물 과 동일한 수의 요소가 있습니다 . 이 샘플의 평균 거리를 계산하십시오. 평균 거리 통계가 많이 나올 때까지 반복하십시오. 거의 모든 랜덤하게 얻은 평균 거리가 x에 대해 측정 한 평균 거리 보다 큰 경우유형 건물의 경우 x 가 우연히 모여 있지 않다는 결론을 내릴 수 있습니다 . 효과는 실제입니다.
(이러한 계산은 'R'과 같은 목적에 적합한 플랫폼에서 가장 잘 프로그래밍되지만 Excel과 같은 거의 모든 컴퓨팅 소프트웨어를 서비스에 제공 할 수 있습니다. 무작위로 배열의 요소.)
이 순열 테스트 방법은이 영역의 건물 개발 패턴을 명시 적으로 설명하기 때문에 사전 프로그래밍 된 솔루션보다 우수합니다. 이렇게하지 않으면, 당신은 종종 합니다 클러스터링의 "중요한"증거를 발견하지만, 클러스터링 다른 요인에 의해 발생했을 수 있기 때문에 당신은 도로의 패턴의 위치로, 그것에서 아무것도 유용하게 결론을 내릴 수 없다 개발에 적합한 사이트 및 기타 여러 가지.
물론 데이터 분석 방법은 분석 동기를 부여하는 실질적인 문제에 의존해야합니다.
그러나 여기 몇 가지 아이디어가 있습니다.
다중 거리 공간 클러스터 분석 방법 : Ripley의 k- 함수 (공간 통계) 작동 방식 : 방정식의 i와 j는 건물 x와 y를 나타냅니다. 리플리의 K- 함수는 확률 론적 추론을 제공 할 것이다.
코 로케이션 패턴 검색을위한 복잡한 알고리즘이 있습니다.