평균 커널 밀도 맵을 지원하기 위해 오류 맵을 작성하는 방법은 무엇입니까?


10

동일한 공간 범위 내에 쌓인 점에서 KDE를 실행하여 평균 커널 밀도 맵을 만들었습니다. 예를 들어, 모양과 크기가 같은 3 개의 다른 숲 틈에 묘목을 나타내는 3 개의 점 모양 파일이 있다고 가정합니다. 각 점 shapefile에 대해 KDE를 실행했습니다. KDE의 출력은 다음과 같이 Arc의 래스터 계산기에서 평균을 계산하기 위해 공간 범위에 따라 쌓 Float(("KDE1"+"KDE2"+"KDE3")/3)입니다. 최종 제품은 다음과 같습니다.

여기에 이미지 설명을 입력하십시오

이제 평균 KDE와 관련된 오류를 나타내는 맵을 작성하고 싶습니다. 오류 맵을 사용하여 핫스팟과 관련된 오류의 양을 시각적으로 보여 주려고합니다 (예 : SW 핫스팟이 한 지점의 차이로 인해 발생합니까?). 평균화 된 KDE와 관련된 오류 맵을 작성하려면 어떻게해야합니까? 겠습니까 MSE는 이 경우 오류의 가장 적합한 측정 할 수?


3
매우 흥미로운 분석입니다. "표준 오류"는 무엇을 의미합니까? "평균"레이어에서 각 밀도 맵에 어떤 종류의 편차 (차이)가 있습니까?
Landscape Analysis

@Landscape Analysis Post는 댓글을 수정하도록 편집되었습니다. 예,이 경우 MSE 추정치가 가장 적절하다고 생각합니다. 기본적으로 각 KDE가 평균 KDE와 어떻게 다른지 보여줍니다. 그래도 ArcGIS 및 / 또는 스크립팅을 사용 하여이 모든 것을 함께 모으는 방법을 모르겠습니다.
Aaron

답변:


8

주의 할

표준 오차는 데이터에 체계적인 오차가 없을 때 샘플링 된 데이터에서 불확실성을 추정하는 유용한 방법 입니다. (가) KDE지도가 있기 때문에 그 가정은 이러한 맥락에서 의심스러운 유효하다 로컬 명확한 계층 사이에서 체계적으로 유지 수있는 오류와 (b) 불확실성의 가능성이 큰 구성 요소가 인해 커널 반경 (또는 "대역폭의 선택에 ")은이지도 모음 중 하나에 전혀 반영되지 않습니다.

몇 가지 선택

그럼에도 불구하고, 관련되고 배치 된 ( "스택 된") 맵 모음 간의 가변성을 묘사하는 것은 훌륭한 아이디어입니다. 방금 설명한 제한 사항을 기억하십시오. 이 설정에서 다음과 같은 여러 지역 변동성 측정 값이 자연 스럽습니다.

  • 가산 적으로 (최대 - 최소값) 또는 곱셈 적으로 (최대 값을 최소값 으로 나눈 값) 값 의 범위 입니다 .

  • 값 의 분산 또는 표준 편차 입니다. 이 곱셈 버전은 값 로그 의 분산 또는 표준 편차입니다 .

  • 사 분위수 범위 (또는 제 3 사 분위 대 제 1 사 분위수의 비율) 와 같은 강력한 분산 추정값입니다 .

많은 측면에서, 곱하기 측정은 밀도에 더 적합 할 수 있는데, 이는 에이커 당 100 나무와 101 나무 사이의 차이는 중요하지 않을 수 있지만, 에이커 당 2 나무와 1 나무 사이의 차이는 상대적으로 중요 할 수 있기 때문이다. 둘 다 101-100 = 2-1 = 1의 동일한 (추가) 범위를 나타내지 만 1.01과 2.00의 곱하기 범위는 실질적으로 다릅니다. (곱하기 범위는 항상 1을 초과하므로 2.00은 1.01보다 1에서 100 배 더 큽니다.)

계산

이러한 측정 값을 계산하려면 일부 형태의 로컬 통계 가 필요 합니다. Spatial Analyst 의 셀 통계 기능은 분산, 범위 및 표준 편차를 계산합니다. 로컬 Quantile은 rank 로 찾을 수 있습니다 . 어느 계급을 까다롭게 사용하기보다는 사 분위수 근처의 편리한 것을 선택하십시오. 그것들을 찾으려면 n을 스택의 격자 수로하십시오. 중앙값의 순위는 (n + 1) / 2이며 정수가 아닐 수도 있습니다. 이는 n / 2 및 n / 2 + 1의 평균을 계산하여 계산해야 함을 나타내며,이 중 하나는 중간 값에 가깝습니다. 사 분위수를 근사하려면 (n + 1) / 2를 가장 가까운 정수로 내림 한 다음 다시 1을 더하고 2로 나눕니다 . 이 수를 r로 합니다. 사용하다사 분위수의 순위에 대한 rn + 1- r .

예를 들어, 스택에 n = 6 그리드가있는 경우 (n + 1) / 2 반올림은 3이고 (3 + 1) / 2 = 2는 반올림 할 필요가 없습니다. 사용 R = 2 및 R = 6 + 1 - 순위 2 = 5. 실제로이 절차는 각 셀에서 6 개의 값 중 두 번째로 낮은 값 ( r = 2)과 두 번째로 높은 값 ( r = 5)을 반환합니다 . 차이 또는 비율을 매핑 할 수 있습니다.


2
변동 계수가이 맥락에서 유용 할 것이라고 생각합니다.
Jeffrey Evans

1
@jeffrey 감사합니다. 그 역시 고려 사항입니다. CV는 (로컬) 표준 편차 그리드를 (로컬) 평균 그리드로 나누어서 얻습니다. 언급하지는 않았지만 그러한 곱셈 요약의 경우 분모 (평균 또는 최소값)가 0에 가까운 영역을 가리기 위해주의를 기울여야합니다. 결과가 신뢰할 수 없으며 아마도 커널을 근사화하는 데 수치 적 부정확성과 작은 부정확성 만 반영됩니다.
whuber

@ whuber, 첫 단락에서 (a)를 자세히 설명해 주시겠습니까? 예를 들어, 각 포리스트 간격에 걸쳐 지속될 수있는 데이터 수집 기술의 오류 (따라서 각 KDE 래스터에 체계적으로 나타남) 또는 초점 함수 의 구현 과 관련된 오류를 언급하고 있습니까?
MannyG

@ whuber 훌륭한 아이디어들-많은 감사합니다!
Aaron
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.