크릭 할 때 왜 가변 량 모델을 제공해야합니까?


9

나는 공간 통계에 익숙하지 않고 많은 튜토리얼을 보았습니다.

그러나 나는 당신이 krige 할 때 왜 가변 량 모델을 제공 해야하는지 알지 못합니다.

R에서 gstat 패키지를 사용하고 있으며 이것이 그들이 제공하는 예입니다.

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

왜 VGM을 먼저 공급해야 하는지를 몇 줄로 설명 할 수 있습니까? 그리고 당신은 어떻게 매개 변수를 설정합니까?

미리 감사드립니다! 카스퍼


들면 간단한 클리 깅 추정기는 평균 및 공분산 공간이 미리 알려진 경우에만 BLUE이다. 보통의 Kriging 에서는 데이터에서 Variogram을 추정 한 다음 보간을 수행합니다. 동일한 뮤즈 데이터 gstatR 패키지 에서 비 네트를 참조하십시오 .
Andy W

앤디, 댓글 주셔서 감사합니다. 나는 바 네토 모델없이 krige 할 수 있음을 삽화에서 발견했습니다. 나는 다음을 수행했다 : krige (residuals ~ 1, temp_plot_spatial, y, nmin = 5, nmax = 10), 그래서 최소 5 이웃과 최대 10을 바라 보면서 krige는 전혀 이해가되지 않습니까? : 결과는 종류 좋은이었다 dropbox.com/s/7lxvfiyfl7ekhb4/...
카스퍼

바리오 그램 모델링에 문제가 있다고 생각합니다. 상관 관계가 거리와 관련이 있지만 가장 가까운 이웃과 관련이 있다고 가정하면 어떻게됩니까?
카스퍼

"상관이 거리와 관련이 있지만 가장 가까운 이웃과 관련이 있다고 가정하면 어떻게됩니까?" -kriging이 아니므로 knn 분류와 더 일치합니다. 이 코드 krige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)는 로컬 바리오 그램을 추정합니다. 예를 들어 전체 스터디 공간에 대한 variogram이 없지만 예측하려는 모든 위치에 대한 새 모델을 추정하십시오. 그런 다음 로컬 모델은 가장 가까운 10 개의 값만 가져옵니다 (최대 거리를 지정하지 않기 때문에 항상 10 개의 값을 nmin가져와야 하므로 불필요합니다).
Andy W

1
그런 다음 로컬 바리오 그램을 추정하는 것이 논리적입니다. 모형의 다른 예측 변수를 포함하여 특정 기능에 따라 다른 경우 옵션도 있습니다. IDW는 가장 단순한 유형의 Kriging Model로 간주 될 수 있으므로 IDW는 실제로 데이터에서 Variogram을 추정하는 것보다 낫지 않아야합니다.
Andy W

답변:


9

소개 및 요약

Tobler의 지리 법칙 주장

모든 것이 다른 모든 것과 관련되어 있지만 가까운 것들이 먼 것보다 더 관련이 있습니다.

Kriging 은 이러한 관계의 모델을 채택합니다.

  • "사물"은 지표면 (또는 공간)의 위치에서 일반적으로 유클리드 평면으로 표시되는 숫자 값입니다.

  • 이러한 수치는 랜덤 변수의 실현으로 가정 합니다.

  • "관련"은 이러한 랜덤 변수의 평균과 공분산으로 표현됩니다.

(공간의 점과 관련된 임의의 변수 모음을 "확률 적 프로세스"라고합니다.) 바리오 그램은 이러한 공분산을 계산하는 데 필요한 정보를 제공합니다.

Kriging이란?

Kriging은 구체적 으로 관찰되지 않은 장소에 대한 예측 입니다. 예측 프로세스를 수학적으로 다루기 쉽게하기 위해 Kriging은 가능한 공식을 관측 값의 선형 함수로 제한 합니다. 그것은 계수가 무엇인지 결정하는 문제를 유한 한 문제로 만듭니다. 이는 예측 절차에 특정 속성이 있어야한다는 것을 알 수 있습니다. 직관적으로, 우수한 특성은 예측 변수와 실제 (알 수없는) 값의 차이가 작아야한다는 것입니다. 즉, 예측 변수가 정확 해야합니다 . 고도로 선전되었지만 더 의심되는 또 다른 속성은 평균적으로 예측 변수가 실제 값과 같아야한다는 것 입니다. 정확 해야합니다 .

(완벽한 정확성을 요구하는 것은 의심의 여지가 있지만 반드시 나쁘지는 않지만) 일반적으로 통계 절차를 덜 정밀하게 만듭니다. 즉, 더 가변적입니다. 대상에서 촬영할 때 림 및 센터에 거의 타격을주지 않거나 센터 바로 옆에 있지만 정확하게 초점을 맞추지 않은 결과를 수락 하시겠습니까? 전자는 정확하지만 정확하지 않지만 후자는 정확하지는 않지만 정확하지 않습니다.)

평균과 공분산은 관련성을 정량화하기위한 적절한 방법, 선형 예측이 작동하고 예측 변수가 완벽하게 정확해야 가능한 정확한 방법이어야한다는 가정과 기준이 공분산이 일관된 방식으로 지정된 경우 고유 한 솔루션 . 결과 예측 변수를 "BLUP": 최상의 선형 편견 예측 변수라고합니다 .

Variogram이 나오는 곳

이러한 방정식을 찾으려면 방금 설명한 프로그램을 운영해야합니다. 이것은 예측 변수와 랜덤 변수로 간주 되는 관측 값 간의 공분산을 기록하여 수행됩니다 . 공분산대수는 관측 된 값들 사이의 공분산도 Kriging 방정식에 들어가게합니다.

이 시점에서 공분산은 거의 항상 알 수 없기 때문에 막 다른 골목에 도달합니다. 결국, 대부분의 응용 프로그램에서 우리는 관찰 임의의 각 변수의 실현을 : 즉, 단지 구성하는 우리의 데이터 셋, 하나 각각 별개의 위치에 번호를. Variogram 입력 :이 수학 함수는 두 값 사이의 공분산을 알려줍니다. 이러한 공분산이 "일관성"이되도록 제한됩니다 (수학적으로 불가능한 일련의 공분산을 제공하지 않는다는 점에서 "관련성"의 모든 수치 측정 모음이 실제 공분산 행렬 을 형성하지는 않습니다 ). 이것이 바로 Kriging에 Variogram이 필수적인 이유입니다.

참고 문헌

즉각적인 질문에 대한 답을 얻었으므로 여기서 멈출 것입니다. 관심있는 독자는 Journel & Huijbregts의 Mining Geostatistics (1978) 또는 Isaaks & Srivastava의 Applied Geostatistics (1989) 와 같은 좋은 텍스트를 참고하여 바리오 그램을 추정하고 해석하는 방법을 배울 수 있습니다 . (추정 과정 은 데이터에서 파생 된 경험적 가변 량과 그에 적합한 모델 가변성 인 "variograms"라는 두 가지 개체를 도입 합니다.이 답변에서 "variogram"에 대한 모든 참조는 모델 vgm에 대한 것입니다. Varioogram 추정과 Kriging이 적절히 결합 된보다 현대적인 접근법은 Diggle &Model-based Geostatistics (2007) (또한 R패키지 GeoR및 확장 설명서 GeoRglm).


코멘트

덧붙여서, 예측을 위해 Kriging을 사용하든 다른 알고리즘을 사용 하든지간에, Variogram에 의해 제공되는 관련성의 정량적 특성화는 모든 예측 절차 를 평가 하는 데 유용 합니다. 모든 공간 보간법은이 관점에서 예측 자이며, 대부분 IDW (Inverse Distance Weighted)와 같은 선형 예측 자입니다. 바리오 그램은 임의의 보간 방법의 평균값 및 분산 (표준 편차)을 평가하는 데 사용될 수 있습니다. 따라서 Kriging에서의 사용을 넘어서는 적용 가능성이 있습니다.


이 자세한 답변에 감사드립니다. 위와 같은 질문을합니다. 공간 상관이 위치와 무관하다는 가정을 할 수 없으면 어떻게합니까? 모든 위치에 대한 Variogram의 모델을 만들어야하므로 Variogram 모델링이 유용하지 않다는 것이 맞습니까? 그러면 IDW를 사용하는 것이 더 낫습니까?
카스퍼

공정의 2 차 정상 성 을 가정 할 수없는 경우, 몇 가지 옵션에는 (1) 공정의 다중 실현 수집 (시간에 따라 변할 때); (2) 지역 소구역에 대한 바리오 그램 추정 (데이터가 많은 경우); (3) (1D 프로세스에 대한 GARCH 모델에서와 같이) 바리오 그램이 위치에 따라 어떻게 변화하는지에 대한 파라 메트릭 모델을 가정한다. 내 마지막 코멘트 직접 IDW처럼 뭔가에 떨어지는 다시의 inadvisability 주소 : 당신이 할 수 있는지 여부를 평가 는 원칙적으로 베리오 그램, 존재 하기 때문에 IDW는 일반적으로 최적입니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.