Kriging Interpolation은 어떻게 작동합니까?


10

Kriging을 사용하여 일부 주변 변수를 기반으로 일부 변수의 값을 예측 해야하는 문제를 연구 중입니다. 직접 코드를 구현하고 싶습니다. 그래서 나는 그것이 어떻게 작동하는지 이해하기 위해 너무 많은 문서를 겪었지만 너무 혼란 스러웠습니다. 일반적으로 가중 평균이라는 것을 이해하지만 가중치 계산 프로세스를 완전히 이해하지 못하고 변수 값을 예측할 수 없었습니다.

이 보간법의 수학적 측면과 작동 방식을 간단한 용어로 설명해 주시겠습니까?


3
코드 구현은 훌륭한 학습 도구이지만 실제 문제를 해결하는 데 권장 할 수는 없습니다. 코드를 작성, 디버깅 및 테스트 할 때 공간 탐색 적 데이터 분석, 변이 법, Variogram의 교차 검증, 이웃 검색 및 Post- kriged 결과 처리. 합리적이고 효과적인 타협은 GSLib 또는 GeoRGLM 과 같은 작업 코드로 시작하여 수정하는 것입니다.
whuber

고마워요. 좋은 생각이지만 Kriging의 수학적 측면을 이해하고 싶습니다. 간단한 용어로 명확하게 설명하는 자료가 있습니까? 감사합니다.
Dania

답변:


15

이 답변은 "Universal Kriging"(영국)의 (가장 현대적인) 시공간 확장을 설명하는 논문을 위해 최근에 쓴 입문 섹션으로 구성되어 있으며, 그 자체는 "Ordinary Kriging"의 일반화입니다. 세 가지 하위 섹션이 있습니다. 이론 은 통계 모델과 가정을 제공합니다. 추정 은 최소 제곱 모수 추정을 간단히 검토합니다. 및 예측 쇼에서는 일반화 된 최소 제곱 (GLS) 프레임 워크에 맞는을 크리깅. 통계 전문가, 특히이 사이트 방문자에게 친숙한 표기법을 채택하고 여기에 잘 설명 된 개념을 사용하려고 노력했습니다.

요약하면 kriging은 랜덤 필드의 BLUP (Best Linear Unbiased Prediction)입니다. 이는 샘플링되지 않은 위치에서 예측 된 값이 샘플링 된 위치에서 관찰 된 값과 공변량의 선형 조합으로 얻어 짐을 의미합니다. (알 수없는 임의의) 값은 샘플 값과 상관 관계가 있다고 가정합니다 (샘플 값은 서로 연관되어 있음). 이 상관 정보는 예측의 분산으로 쉽게 변환됩니다. 예측에서 제로 바이어스 조건에 따라이 편차를 가능한 작게 만드는 선형 조합 ( "크릭 가중치")의 계수를 선택합니다. 자세한 내용은 다음과 같습니다.


이론

영국은 연구 영역에 대한 GLS 모델의 맥락에서 수행되는 두 가지 절차 (추정 중 하나와 예측 중 하나)로 구성됩니다. GLS 모델 전제로 샘플 데이터 것을 경향 주위 랜덤 편차의 결과와 그 편차는 상관 관계가있다. 경향은 p의 미지수 계수 (매개 변수) β = ( β 1 , β 2 , , β 의 선형 조합에 의해 결정될 수있는 값의 일반적인 의미로 의미된다나는, (나는=1,2,...,) . (이 글 전체에서 프라임 ' 이고 전치 행렬, 모든 벡터는 칼럼 벡터로 간주한다.)β=(β1,β2,,β)''

연구 지역 내의 임의의 위치에 수치 속성 가능한 튜플가 '독립 변수 '또는 불리는 "을 공변량." (일반적으로 y 1 = 1 은 "일정한 항"이며, y 2y 3 은 공간 좌표 일 수 있으며 추가 y i와이=(와이1,와이2,,와이)'와이1=1와이2와이와이나는물론 이러한 펌핑 대수층 또는 거리의 기공율로 학습 영역에서 모든 위치에 사용할 공간 정보 및 다른 부가 정보를 나타낼 수있다.) 각 데이터 위치 그 공변량 외에 Y = ( y i 1 , y i 2 , , y i p ) ' 에서 관련 관측 값 z i 는 랜덤 변수 Z i 의 실현으로 간주됩니다 . 대조적으로, y i나는와이나는=(와이나는1,와이나는2,,와이나는)'나는나는와이나는는 관측치에 의해 표현 된 점들 또는 작은 영역들 (데이터 "지지들")에 의해 결정되거나 특성화되는 값들로 생각된다. 확률 변수의 실현되는 것으로 간주되지 않으며 임의의 특성과 무관 할 필요 Z의 I .와이나는나는

선형 조합 는 매개 변수 β 와 관련하여 Z i 의 예상 값을 나타냅니다 . 위치 i 에서의 추세 값 . 추정 과정은 값을 찾기 위해 데이터를 사용하여 β I를 미지 매개 변수가 나타내는 β I을

이자형[나는]=와이'나는β=와이나는1β1+와이나는2β2++와이나는β
나는β나는β^나는β나는예측 프로세스는 위치의 데이터를 사용하여 샘플링되지 않은 위치의 값을 계산합니다. 여기서는 i = 0으로 색인됩니다 . 추정 대상은 고정 된 ( , 비 랜덤) 파라미터이지만, 예측 대상은 랜덤이다. 값 z 0 은 트렌드 y ' 0 β 주위의 랜덤 변동을 포함 하기 때문이다 . 일반적으로 위치 0 을 변경하여 동일한 데이터를 사용하여 여러 위치를 예측합니다.나는=1,2,,나는=00와이0'β0. 예를 들어, 종종 윤곽에 적합한 규칙적인 점 그리드를 따라 표면을 매핑하도록 예측이 이루어집니다.

견적

고전적인 크 래깅은 랜덤 변동 가 0의 예상 값을 가지고 공분산이 알려져 있다고 가정합니다 . Z iZ j 사이의 공분산 을 c i j 로 씁니다 . 이 공분산을 사용하여 추정은 GLS를 사용하여 수행됩니다. : 그 해결책은 다음과 같다 β = H의 Z , H = ( Y ' C - 1 Y ) - 1 Y는 ' C - 1 여기서, Z = ( Z 1나는나는제이나는제이

β^=H, H=(와이'1와이)1와이'1
는 IS N 개의 관측 - 벡터, Y는 = ( Y I의 J ) (이하 "디자인 매트릭스")은이고 , N 에 의해 P의 행 벡터에있는 행렬 Y ' I , 1 I n 이고 C = ( c i j ) 는불가역으로 가정되는 n x n 공분산 행렬입니다 (Draper & Smith (1981), 섹션 2.11). 그만큼=(1,2,,)Y=(yij)np와이나는',1나는=(나는제이) 에 의해 N 개의 행렬 H 데이터 프로젝트 Z를 추정 파라미터에 β는 상기 "모자 매트릭스"라고합니다. 제제 β 명시 적으로 데이터를 상기 파라미터 추정치는 데이터에 의존 선형 방법을 설명하는 모자 행렬의 적용 등. 공분산 C = ( c i j ) 는 데이터 위치 측면에서 공분산을 제공하는 Variogram을 사용하여 고전적으로 계산되지만 공분산이 실제로 계산되는 방식은 중요하지 않습니다.Hβ^β^=(나는제이)

예측

UK 마찬가지로 예측 데이터의 선형 결합에 의해 Z 0 = λ 1 Z 1 + λ (2) (Z) 2 + + λ N Z N = λ ' Z . λ 의 예측을위한 "클리 깅 가중치"라고 Z 0 . UK는 이러한 예측을 수행 Z 0 개의 조건을 충족시키는 것을들 수있다. 먼저, 예측은 편향되지 않아야하며, 이는 랜덤 변수의 선형 조합을 요구함으로써 표현됩니다.0

^0=λ11+λ22++λ=λ'.
λ나는00 같음 Z 0 평균 : 0 = E [ Z 0 - Z 0 ] = E [ λ ' Z - Z 0 ] . 이 기대 값은 Z 0 Z = ( Z 1 , Z 2 , , Z n ) 의 결합 n + 1- 변량 분포에 대해 취합니다.나는0
0=E[Z^0Z0]=E[λZZ0].
n+1Z0Z=(Z1,Z2,,Zn). 함께 그래프 가정 (1)과 기대의 선형성을 의미한다 :
0=E[λZZ0]=λE[Z]E[Z0]=λ(Yβ)y0β=(λYy0)β=β(Yλy0)

β

Y^λ=y0.

λZ^0Z0

Var(Z^0Z0)=E[(Z^0Z0)2]=E[(λZZ0)2]=c002λc0+λCλ
c0=(c01,c02,,c0n)Z0Zi, i1c00Z0

λμ와이^'λ=와이0+

(와이와이'0)(λμ)=(0와이0)
01λ
λ=H'와이0+1(1와이H)0.

(다중 회귀에 익숙한 독자는이 솔루션을 공칭 기반 최소 제곱 법선공분산 기반 솔루션과 비교하는 것이 도움이 될 수 있습니다.이 방정식 은 거의 동일하지만 Lagrange 승수 항이 없습니다.

λ[H'와이0]0^0


1
정말 whuber 감사합니다, 이것은 내가 찾고있는 정확히입니다. 당신은 나를 위해이 문제를 해결했습니다. 이제 저는 Kriging을 이해합니다. 도움을 주셔서 감사합니다. 대단히 감사합니다.
Dania

와이^'

와이'=(와이제이나는)와이나는,1나는
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.