마지막으로 회귀 분석 및 통계 모델링의 자료입니다. 다항식 회귀 분석은 대부분의 교과서에서 설명합니다. ( Draper와 Smith 는 5 장에서 다루고 있습니다.) Excel에서 산점도에 직선을 맞추는 것과 비교하여 지리 참조에 대해 특별한 것은 (수학적으로) 없습니다. 더 많은 변수가 있습니다. (실제로 신뢰하는 경우 Excel을 지리 참조하도록 설득 할 수 있습니다 ;-).
이제 몇 가지 경험 법칙에 대해 :
정확도 요구 사항을 충족 하는 가장 낮은 순서 를 사용하십시오 . (자세한 내용은 아래 # 7을 참조하십시오.)
발생했을 수있는 왜곡 을 나타낼 수있는 방법을 사용하십시오 . 종이지도 스캔을 사용하면 왜곡이 국소적이고 불규칙 할 수 있으므로 스플라인을 고려하십시오. 프로젝션 변경 (대부분의 항공 및 위성 이미지 처리에서 발생하는 것을 포함하여)으로 사용하기에 적합한 변환은 프로젝션입니다. 프로젝션 변환은 다항식 (일반적으로)이나 스플라인이 아닙니다. 소프트웨어가이를 지원하지 않는 경우 2 차 다항식은 종종 합리적인 근사치를 제공합니다.
과적 합하지 마십시오 . 지리 데이터 소스의 정확도에는 제한이 있습니다. 당신은 RMSE는, 그 부정확 거의 동일되고 싶어 하지 크게 낮 춥니 다.
특히 더 높은 거듭 제곱 (2 차 이상의 다항식)을 사용 하는 경우 외부 링크를 제거했습니다 . 단일 특이 치조차도 변형을 심하게 왜곡시킬 수 있습니다. 변환을 계산하는 데 사용되지 않는 일부 링크를 작성하고 변환이 결과를 얼마나 잘 해결하는지 확인하여 결과를 교차 검증하십시오.
최고의 정확도를 위해 가장 작은 영역을 지리 참조하십시오 . 관심있는 것 이상으로 많은 지역을 지리 참조 할 필요가 없으며, 그렇게하면 연구 지역 내지도의 질이 떨어질 수 있습니다.
유연성을 위해 약간 넓은 영역을 지리 참조하십시오 . 조만간 인접한 지역에서 데이터를 가져와야 할 수도 있습니다. 경계가 겹치는 경계 근처에 공통된 제어 지점을 마련하는 데 큰 도움이됩니다. (이 규칙은 이전 규칙과 충돌합니다!)
연구 영역 의 경계 주위에 제어점을 만드는 것이 좋습니다. 기하학적으로, 대부분의 지역은 어쨌든 경계 근처에 있습니다. 통계적으로, 이러한 극한 제어점에서 최상의 정보를 얻을 수 있습니다. 적합도를 확인하고 다항식 차수를 평가하려면 내부에서 몇 개를 사용하십시오. 경계점 만 기준으로 맞춤이 허용되지만 내부 점이 제대로 맞지 않으면 다항식 차수를 늘려야 할 수도 있습니다.