공간 상관도에서 U 자형 패턴의 원인은 무엇입니까?


12

나는 내 자신의 연구 에서 다양한 거리에서 공간적 상관 관계를 조사 할 때이 패턴이 상관 관계에서 U 자형 패턴이 나타나는 것을 알았습니다 . 보다 구체적으로, 작은 거리 빈에서 강한 양의 상관 관계는 거리에 따라 감소한 다음 특정 지점에서 구덩이에 도달 한 후 다시 올라갑니다.

다음은 Conservation Ecology 블로그, Macroecology playground (3) – Spatial autocorrelation의 예 입니다.

모란의 I 코렐로 그램

더 먼 거리에서 이러한 더 강한 양의 자동 상관 관계는 이론적으로 Tobler의 첫 번째 지리 법칙을 위반하므로 데이터의 다른 패턴으로 인해 발생할 것으로 예상됩니다. 나는 그들이 특정 거리에서 0에 도달 한 다음 더 먼 거리에서 0 주위로 맴돌기를 기대할 것입니다 (이것은 일반적으로 낮은 AR 또는 MA 항의 시계열 도표에서 발생합니다).

Google 이미지 검색 을 수행 하면 동일한 유형의 패턴에 대한 몇 가지 다른 예를 찾을 수 있습니다 (다른 예는 여기 참조 ). GIS 사이트의 사용자가 패턴이 Moran 's I에 대해서는 나타나지만 Geary 's C ( 1 , 2 ) 에는 나타나지 않는 두 가지 예를 게시했습니다 . 내 작업과 함께 이러한 패턴은 원래 데이터에서 관찰 할 수 있지만 공간 항을 사용하여 모형을 피팅하고 잔차를 확인할 때 지속되는 것으로 보이지 않습니다.

비슷한 ACF 플롯을 표시하는 시계열 분석의 예제를 보지 못했기 때문에 원본 데이터의 패턴이 어떤 원인인지 알 수 없습니다. 이 의견에서 Scortchi는 정현파 패턴 이 해당 시계열의 계절 패턴이 생략되어 발생할 수 있다고 추측합니다 . 동일한 유형의 공간 추세가 공간 상관 관계에서이 패턴을 유발할 수 있습니까? 아니면 상관 관계가 계산되는 방식의 다른 인공물입니까?


여기 내 작품의 예가 있습니다. 표본은 상당히 크며 연한 회색 선은 참조 분포를 생성하기 위해 원본 데이터의 19 개의 순열 집합입니다 (따라서 빨간색 선의 분산이 상당히 작을 것으로 예상 됨). 따라서 줄거리가 처음 표시된 것만 큼 극적이지는 않지만 구덩이와 거리가 더 멀어지면 줄거리에 쉽게 나타납니다. (또한 내 예의 구덩이는 다른 예와 마찬가지로 부정적이지 않습니다.

여기에 이미지 설명을 입력하십시오

상기 코렐로 그램을 생성 한 공간 분포를보기위한 데이터의 커널 밀도 맵이있다.

DC의 KDE 범죄


1
I

@ user777에서 오는 위치를 알 수 있지만 공간적 이웃이 무겁게 증가함에 따라 플롯이 0으로 경향을 나타내는 유사한 인수를 기대할 수 있습니다. 즉, 이웃이 커질수록 이웃 평균이 대 평균에 가까워 질 것입니다. 내 머리 속에는 상관 관계가 0이 아닌 0으로 향하게되지만 쉽게 잘못 될 수 있습니다. (동일한 주장도 시계열에도 적용되어야하며, 이와 같은 시계열에 대한 ACF 도표를 본 기억이 없습니다.)
Andy W

DC의 kde는 체스 판을 조금 생각 나게합니다. 체스 판의 공간 자기 상관은 어떤 모습입니까? 가까운 거리 (동일한 광장)에서 높지 않을지, 조금 더 낮게 (다른 광장), 다시 높은 곳이 아닌지 궁금합니다. 그래도 이것이 답인지 알기에는이 주제에 대해 충분하지 않습니다.
gung-Monica Monica 복원

@ gung, 그것은 경우에 거리를 공식화하는 방법에 달려 있습니다. 여왕 연속성 이 있는 바둑판의 경우 음의 자동 회귀 용어와 동의어입니다. 시계열의 경우 ACF 플롯이 양의 상관 관계와 음의 상관 관계 사이의 대안이 될 것입니다 (이 경우 파도가 매우 빨리 감쇠됩니다) ). 공간 분석에서는 시계열보다 복잡합니다. 그래도이 패턴을 바둑판으로 특성화하지는 않습니다.
Andy W

2
데이터 세트에는 실제로 5km 거리에서 자기 공분산을 추정 할만큼 충분한 공간 범위가 없습니다 (전체 면적이 10km를 넘지 않으며 일반적으로 여러 번 포함하는 데이터 세트를 원합니다) 상관 관계 길이.) 기본적으로 대략 5K 정도의 얼룩이 있고 그 사이에 간격이있는 대략 3 개의 "범죄"가 대략 삼각형 모양 인 것으로 보입니다. 따라서 그 길이에서 양의 상관 관계를 보는 것은 놀라운 일이 아닙니다.
Brian Borchers

답변:


4

설명

U 자형 코렐로 그램은 현상이 발생한 영역의 전체 범위에서 계산을 수행 할 때 일반적으로 발생합니다. 토양이나 지하수의 국지적 오염과 같은 자연에서 깃털 같은 현상이 나타나거나,이 경우 현상이 일반적으로 연구 지역 (지구 고밀도 도시 중심을 가지고 있으며 저밀도 교외로 둘러싸인 컬럼비아).

코렐로 그램은 공간 분리 량에 따라 모든 데이터의 유사도를 요약한다는 것을 상기하십시오. 값이 클수록 비슷하고 값이 작을수록 비슷합니다. 큰 공간 분리가 달성 될 수있는 포인트의 쌍은 맵의 정반대 측면에 해당 누워있다. 따라서 코렐로 그램은 경계를 따라 값을 서로 비교합니다. 데이터 값이 전체적으로 경계를 향해 감소하는 경향이있는 경우, 코렐로 그램은 작은 값과 작은 값만 비교할 수 있습니다. 그것들이 매우 유사하다는 것을 알게 될 것입니다.

따라서 모든 깃털 모양 또는 다른 공간적 단발 현상에 대해, 우리는 상관 관계가 영역의 직경의 약 절반에 도달 할 때까지 상관 관계가 감소 할 것으로 예상되는 데이터수집하기 전에 예측할 수 있습니다 .

이차 효과 : 추정 변동

두 번째 효과는 장거리보다 짧은 거리에서 상관 관계를 추정하는 데 사용할 수있는 데이터 포인트 쌍이 더 많다는 것입니다. 중거리에서 장거리에서는 이러한 점 쌍의 "지연 인구"가 감소합니다. 이것은 경험적 상관 관계의 변동성을 증가시킵니다. 때때로이 변동성만으로는 코렐로 그램에서 특이한 패턴을 만들 수 있습니다. 분명히 큰 데이터 세트가 맨 위 ( "Moran 's I") 그림에서 사용되었는데,이 효과는 감소하지만 그럼에도 불구하고 3500 이상의 거리에서 플롯의 로컬 변동 진폭이 커지면 변동성의 증가가 분명합니다. 최대 거리.

그러므로 공간 통계에서 오랜 경험을 바탕으로 연구 영역의 직경의 절반보다 큰 거리에서 코렐로 그램을 계산하는 것을 피하고 예측 (예 : 보간)과 같은 큰 거리를 사용하지 않는 것이 좋습니다.

공간 주기성이 정답이 아닌 이유

공간 통계에 관한 문헌은 실제로 공간적으로주기적인 패턴이 더 먼 거리에서 코렐로 그램에서 리바운드를 유발할 수 있다고 지적합니다. 광업 지질 학자들은 이것을 "구멍 효과"라고 ​​부릅니다. 정현파 항을 포함하는 다양한 종류의 바리오 그램이 모델링하기 위해 존재합니다. 그러나,이 바리오 그램은 모두 거리에 따라 약간의 붕괴를 유발하므로 첫 번째 그림에 표시된 전체 상관 관계로의 극심한 복귀를 설명 할 수 없습니다. 더욱이, 2 차원 이상에서, 현상이 등방성 (방향성 상관 관계가 모두 동일한) 및주기적인 것이 불가능하다. 따라서 데이터의 주기성만으로는 표시된 내용을 설명하지 않습니다.

할 수있는 일

이러한 상황에서 진행하는 올바른 방법은 현상이 정지되지 않았다는 점을 받아들이고 그 드리프트 주위에 추가 변동이 있는 결정적인 형태 ( "드리프트"또는 "트렌드")로 설명하는 모델을 채택하는 것입니다. 공간적 (및 시간적) 자기 상관을 가질 수 있습니다. 범죄 수와 같은 데이터에 대한 또 다른 접근 방식은 단위 인구 당 범죄와 같은 다른 관련 변수를 연구하는 것입니다.


감사합니다. 에지 효과에 대한 임시 가중치가 필요하다고 생각하십니까? (이는 모델 잔차에 대한 탐색 적 분석에 너무 과잉 일 수 있습니다.) 나의 논문 나는 실제로 비선형 공간 드리프트와 추세 용어를 사용하고 있습니다. 단위 인구 당 범죄는 여러 가지 이유로 성가시다. 주거 인구는 실제로 관심의 기준선이 아닙니다. 인구를 걷는 것과 비슷합니다. 도심 지역은 특정 시간 동안 많은 (20 ~ 30 회) 팽창 할 수 있으며 비거주 기관 (업무 및 오락)과 더 관련이 있습니다.
앤디 W

Andy는 고유 한 모델을 식별 할 수있는 방법이 없기 때문에 많은 선택이 가능합니다. 확률 공간 모델. U 자형 코렐로 그램은 드리프트를 모델링 하는 일부 메커니즘이 필요하다는 강력한 표시로 이해 될 수 있습니다 . (총체적으로 추정 할 수있는 경우에도) 관련 모집단에 의한 정규화는 사용 가능한 방법 중 하나입니다. 공변량으로 인구 측정 (또는 사용 등)을 포함시키는 것도 또 다른 방법입니다.
whuber

저는 토지 이용 활동 (바, 주유소, 병원, 학교 등)과 공간 용어에 대한 광범위한 측정법을 사용하여 가까이 왔습니다. 여기 다른 공변량을 일정하게 유지하는 예측의지도가 있습니다. 그래도 여전히 약간의 잔여 자동 상관 관계가 있습니다. 작은 장소에 인구가 얼마나 많은 dasymetric 매핑이 도움이 될지에 대해서는 회의적이지만, 그 분석을 결국 수행 할 것이라고 생각합니다.
Andy W

이론적으로 모델의 드리프트 구성 요소의 개발을 안내하고 잔차를 평가하여 공간 자기 상관을 모델링하는 데 어려움이 있는지 판단합니다. 많은 경우에있어서, 명백한 공간 관계의 대부분은 드리프트 용어로 적절히 설명되며 완전한 지리 통계적 기계가 필요한 경우는 거의 없습니다. 문제의 흥미로운 측면 중 하나는 기본 메트릭 (공간 거리) 이 유클리드 거리가 아닌 거리 네트워크를 따라 이동 시간 또는 이동 거리 여야한다는 것 입니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.