공간 통계 도구 : 래스터 데이터에 대한 클러스터링 분석


9

분명히 간단한 문제가 있지만 사용할 명확한 방법을 찾을 수 없습니다.

나는 CIESIN의 세계 데이터 세트Gridded Population을 사용하여 벡터 볼록 다각형으로 "도시 지역"을 구분해야합니다.

이 데이터 세트는 래스터 파일로 전세계 인구 밀도 값을 제공합니다. 문제는 이미 짐작했듯이 밀도 값이 매우 변하고 "도시"의 정의가 비교적 상대적이라는 것입니다.

나는 고전적인 접근법을 사용하여 밀도 값이 고도 인 것처럼 기울기를 계산했지만 기울기 값도 매우 이질적이고 공간적으로 복잡하고 복잡했습니다.

ArcGIS와 GeoDa를 사용하는 공간 클러스터링 알고리즘 인 LISA 도구 (Spatial Association의 Local Indocators)를 살펴 보았지만 매우 구체적인 도구 중에서는 상당히 길을 잃었습니다. 일부 방법은 벡터 모양에서만 작동하므로 재 분류 및 벡터화가 필요합니다 (긴 계산).

사용할 메소드 및 도구 세트를 구체화하는 데 도움을 줄 수 있습니까? 감사 !


2
"urban"에 대한 정의 무엇입니까 ? BTW, 모든 도시 지역이 볼록 다각형 으로 적절하게 묘사되는 것은 아닙니다 . 많은 지형이 볼록한 지형, 산, 해안선 및 강에 의해 모양이 제어됩니다.
whuber

상수가 아닌 정의가 제공되지 않습니다. 목표는 환경과 관련하여 실질적으로 밀도가 높은 영역을 찾는 것입니다. 공간 통계와 LISA에 대한 아이디어입니다. 당신은 볼록함에 대해 맞습니다. "자체 교차하지 않고 다른 다각형과 교차하지 않아야합니다."
Laurent Jégou

보완으로, 공간 응집 도구 전용의 전체 R 모듈 인 spdep을 찾았습니다.
Laurent Jégou

답변:


4

내 MSc http://ian01.geog.psu.edu/papers/mscthesis.pdf 에 대해이 작업을 수행했습니다. 기본적으로 그라디언트 변경에 대해 작업했지만 토론이 도움이 될 수 있습니다.


고마워, 내가 곧 읽을 것이다, 그러나 유망한 :-)
Laurent Jégou

제한된 테스트 영역에서 논문에서 설명하는 이중 Sobel 2 차 미분법을 시도했지만 매우 흥미 롭습니다! 명확한 도시 커널은 분리되어 있으며 밀도 값이 매우 다릅니다. 많은 감사 :) 그런데 나는 무료 및 오픈 소스 소프트웨어를 사용하여 회선 및 래스터 수학을 계산했습니다 : Opticks.
Laurent Jégou

인공 조명의 측정은 도시 조건에 좋은 대리가 될 것입니다. Google 검색은 예제 연구를 찾아야합니다.
b_dev

@indiehacker-나는 그것을 보았지만 문화적으로 의존적입니다. 예를 들어 프랑스는 영국보다 훨씬 어둡습니다.
Ian Turton

6

인구 밀도의 관점에서 볼 때 "도시 지역"은 일반적으로 몇 가지 공리적 기준 을 충족해야 합니다 .

  1. 그 경계는 내부의 최대 밀도와 비교하여 (상대적으로) 높은 밀도의 점을 포함해서는 안됩니다.

  2. 간단히 연결해야합니다 ( "구멍"없음).

  3. 평균 인구 밀도는 사전 지정된 임계 값을 초과해야합니다.

공리 (1) 가 가장 자연 스럽다. 만약 경계 지점이 고밀도라면, 경계를 바깥쪽으로 옮겨 도시 지역 내에 그 지점을 포함시킬 것이다. "상대적"은 10 분의 1 또는 100 분의 1과 같은 최대 값의 비율을 의미한다고 제안하고 싶습니다 . 공리 (2) 는 도시에서 자연적으로 발생하는 공원 및 기타 저밀도 지역을 배제하는 것을 피합니다. Axiom (3) 은 임계 값에 의존하기 때문에 다소 임의적이므로 작은 컴팩트 한 마을을 제거합니다.

실제로, 하나 이상의 다른 자의성 요소가 있습니다. 인구 밀도의 그리드 맵은 암시 적으로 주변 지역의 인구를 평균화합니다 (일부 경우 하나의 셀과 같고 커널 밀도 추정의 경우 커널 반경과 동일). 이 암시 적 이웃 크기 (원래 밀도 맵에서 먼저 초점 수단 또는 다른 커널 스무딩으로 변경 될 수 있음),이 모집단 임계 값 및 공리 1의 "상대적으로 높은"감각을 사용자가 설정 가능한 매개 변수로 받아들입니다. 결과.

이러한 공리는 자연스럽게 매우 간단한 알고리즘으로 이어집니다 . 국가 최대 점을 찾고 경계가 공리를 충족시킬 때까지 주변을 살펴보고 (1), 공리를 충족시키기 위해 구멍을 채우고 (2) 모든 후보 영역을 스크리닝해야합니다 (3)에 따라. 이것은 다음과 같이 수행됩니다.

  1. 선택적으로 밀도 맵을 부드럽게합니다.

  2. 밀도 관련 맵에서 "채우기"알고리즘을 수행하십시오 (아래 참조).

  3. Region 결과를 그룹화합니다.

  4. RegionGrouped 다각형에서 구멍을 제거하십시오.

  5. 채워진 다각형에 대해 인구 밀도의 구역 합계를 수행합니다.

  6. 모집단 (밀도) 임계 값 아래에 합계 (또는 평균 밀도)가있는 다각형을 제거합니다.

남은 것은 솔루션입니다.

단계 (1)에 대해 조금 더 이야기하겠습니다. 이것이 핵심입니다. 채우기 알고리즘은 "싱크"를 식별하고 높이보다 일정한 양까지 "채 웁니다". 이것은 정확히 공리 (1) 제공 할 우리에게 요구하시는의 (a) 우리는 할 수있다 "싱크" "로컬 최대"그리고 (b) 메이크업의 역할을 "위의 일정 금액"은 "일정한 역할 놀이 분수 의를. " 이를 수행하는 방법 은 밀도음의 로그를 채우는 것 입니다밀도 자체보다는. (0을 포함하는 모든 셀이 문제를 일으키지 않도록 로그를 기록하기 전에 밀도에 먼저 작은 상수 (예 : 제곱 킬로미터 당 약 0.1 명)를 추가하십시오. 음의 로그 밀도의 "레이크"는 후보를 식별합니다. 도시 지역. 당신은 여전히 ​​재생할 세 개의 독립적 인 매개 변수를 가지고 있습니다 (0, 1 및 5 단계에서 입력). 이를 설정하려면 실험뿐만 아니라 "도시 지역"이 실제로 무엇을 의미하는지에 대한 생각이 필요합니다.


자세한 답변 주셔서 감사합니다. 음수 로그를 사용하여 채우기 알고리즘을 테스트 할 올바른 소프트웨어 도구 (또는 프로그래밍 도구)를 찾으려고 노력합니다.
Laurent Jégou
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.