다양한 해상도의 래스터를 처리 할 때 최고 또는 최저 해상도로 다시 샘플링해야합니까?


16

다른 해상도와 투영으로 래스터 데이터 레이어를 처리하는 모범 사례에 대한 권장 사항을 찾고 있습니다. 내가받은 조언은 분석을 수행하기 전에 항상 가장 낮은 해상도로 레이어로 다시 샘플링하는 것이지만, 이것은 나에게 큰 정밀도 낭비처럼 보이지만 왜 그렇게 해야하는지에 대한 확실한 설명을 얻지 못했습니다.

더 높은 해상도의 그리드와 일치하도록 리샘플링하는 것이 합리적이며 더 낮은 해상도로 리샘플링하는 것과 비교하여 어떤 영향이 있습니까?

나는 이것이 상황에 따라 크게 다를 수 있음을 알고 있습니다. 나는 일반적으로 일반적인 지침을 찾고 있지만 다음은 참조를위한 구체적인 시나리오입니다.

시나리오 : 다양한 환경 및 사회 경제 계층을 기반으로 토지 사용을 예측하는 공간 회귀 모델을 구성하려고합니다. 내 토지 사용지도는 Landsat에서 파생되었으므로 30m 해상도입니다. 설명 레이어의 예로는 SRTM DEM (3 arc-seconds, ~ 90m) 및 Bioclim 기후 레이어 (30 arc-seconds, ~ 1km)가 있습니다.


1
회귀 모델 및 구현 방법에 대한 자세한 정보를 제공 할 수 있습니까? 잘 짜여진 흥미로운 질문에 +1!
Aaron

나는 삼림 커버리지를 두 시점에서 비교하고 내 반응으로 (이진) 삼림 벌채 가능성을 가진 로지스틱 회귀 모델을 사용하고 있습니다. R로 구현하겠습니다.
Matt SM

답변:


17

사실 그것은 모든 상황에 의존하는 것이 아니며 통계적 오류에 관한 것입니다.

더 높은 해상도로 다시 샘플링 할 때마다 잘못된 정확도가 발생합니다. 정수로만 피트 단위로 측정 된 데이터 세트를 고려하십시오. 주어진 지점은 실제 위치에서 +/- 0.5 피트 일 수 있습니다. 가장 가까운 열 번째로 다시 샘플링하면 주어진 숫자가 실제 위치에서 +/- 0.1 이하인 것입니다. 그러나 원래 측정 값이 정확하지 않다는 것을 알고 있으며 이제는 오차 범위 내에서 작동하고 있습니다. 그러나 반대로 다른 해상도로 다시 샘플링하면 더 큰 샘플의 오차 한계 내에 포함되어 있기 때문에 주어진 포인트 값이 정확하다는 것을 알 수 있습니다.

통계 수학 이외에, 이것이 가장 먼저 떠오르는 것은 토지 측량입니다. 더 오래된 측량은 가장 가까운 반분까지의 거리와 발의 10 분의 1까지만 거리를 지정했습니다. 이러한 측정으로 경계 트래버스를 플로팅하면 종종 피트로 측정 된 오작동 (시작점과 끝 점이 동일해야하지만 그렇지 않은)이 발생할 수 있습니다. 현대식 설문 조사는 최소한 가장 가까운 초 단위로 진행됩니다. 도출 된 값 (예 : 로트 면적)은 정밀도 차이에 의해 크게 영향을받을 수 있습니다. 파생 된 값 자체는 지나치게 정확한 것으로 주어질 수도 있습니다.

분석 사례에서 더 높은 해상도로 리샘플링하면 결과가 기반이되는 데이터보다 정확도가 훨씬 높아집니다. SRTM을 90m로 고려하십시오. 그들이 높이를 측정하는 방법 (avg / max / mean return)에 상관없이, 이웃과 구별 할 수있는 가장 작은 단위 (픽셀)는 90m입니다. 30m으로 다시 샘플링하면 다음 중 하나를 수행하십시오.

  • 당신은 9 개의 결과 픽셀이 실제로 하나의 중심 일 때, 또는 왼쪽 상단 (또는 없음) 일 때 같은 높이라고 가정합니다.
  • 픽셀 사이를 보간하여 이전에는 없었던 파생 값을 만듭니다.

따라서 두 가지 경우 모두 새로운 하위 샘플이 실제로 측정되지 않았기 때문에 잘못된 정확도가 발생합니다.

관련 질문 : 토지 적합성을 모델링하는 데 어떤 관행이 있습니까?


그것은 확실히 포인트 데이터를 유지합니다. 그러나 위치의 정밀도와 측정 된 양의 정밀도가있는 곳에서 지속적으로 변하는 공간적 양을 평균하는 래스터 데이터가 다른지 궁금합니다. 또한, 다른 양은 다른 레벨의 공간 변화를 갖는다. 예를 들어, 고도 데이터를 더 높은 해상도로 리샘플링하면 대초원보다 산악 지역에서 더 많은 오류가 발생해야합니다.
Matt SM

@MattSM 모든 공간 데이터에 적용되며 측정 된 수량의 통계 오류에 의해 합성됩니다. SRTM을 90m로 고려하십시오. 그들이 높이를 측정하는 방법 (avg / max / mean return)에 상관없이, 이웃과 구별 할 수있는 가장 작은 단위 (픽셀)는 90m입니다. 30m으로 리샘플링하면 결과 픽셀 중 9 개가 모두 같은 높이라고 할 수 있습니다. 실제로 하나만 (또는 없음!)-중앙 또는 왼쪽 상단입니다. 또는 픽셀간에 보간하여 이전에는 존재하지 않았던 값을 생성하므로 정확도가 잘못됩니다. 그리고 네, 값 범위는 잠재적 인 오류에 영향을줍니다.
Chris W

참고로 패턴이 명확하게 제한되는 특수한 경우에 특정 기능 을 보간 할 수 있습니다. 비 지리적 기능 중 하나는 기억하기에 너무 낮은 사진에서 번호판 정보를 재구성하는 것입니다. 그러나 당신은 당신이보고있는 것을 알아야합니다. 문제의 판이 아랍어와 같은 유럽 이외의 대본에 있었기 때문에 번호판 재구성이 실패한 경우를 회상합니다.
Steve Barnes

호 기반 해상도의 래스터는 다른 지역 / 종횡비가 될 수있는 그리드 셀이 없습니까?
CMCDragonkai

@CMCDragonkai 데이터 표현 대 형식 및 좌표 시스템 / 투영에 들어가기 때문에 어떻게 해결할 수 있는지 잘 모르겠습니다. 예, 래스터의 지리적 영역이 반드시 정사각형 (또는 다른 종횡비) 픽셀만큼 균일하지는 않습니다. 많은 sat 데이터 사양이 이것을 알려줍니다 (픽셀은 nadir에서 x이고 swath edge에서 y입니다). 그러나 리샘플링 문제는 여전히 적용됩니다. (지연해서 죄송합니다. 한동안 SE에 없었습니다.)
Chris W
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.