kriging에 관한 혼란


9

나는 kriging과 관련된 이 wikipedia 기사를 읽고 있었다 . 나는 그것이 말할 때 그 부분을 이해하지 못했다

클리 깅 계산해 선형 비 편향 추정기 최고의, 의 되도록 unbiasedness 조건 최소화의 분산을 클리 깅. 나는 파생을 얻지 못했고 분산이 어떻게 최소화되는지. 어떤 제안?Z^(x0)Z(x0)

특히, 나는 불편한 상태에 최소화 된 대상을 적용하는 부분을 얻지 못했습니다.

그랬어 야한다고 생각합니다

E [Z '(x) -Z (x)] 대신 E [Z'(x0) -Z (x0)]가 아닙니다. '는 위키 기사의 hat과 같습니다. 또한 kriging 오류가 파생되는 방법을 얻지 못했습니다.


당신은 파생에서 어디 끊지?
whuber

Kriging 오류를 계산하고 편견 상태를 부과하는 부분입니다. 편향되지 않은 조건은 추정기의 기대치를 의미하며 실제 조건은 동일하다는 것이 좋습니다. 세부 정보를 포함하도록 게시물을 편집했습니다.
user31820 2016 년

Wikipedia 표현식이 이어야한다고 생각합니다 . E[Z(x0)Z(x0)]
whuber

답변:


13

가정 벡터가 인 것은 알려지지 평균의 다변량 분포가 가정 및 알려진 분산 공분산 행렬 . 이 분포에서 를 관찰 하고 편견없는 선형 예측 변수를 사용하여이 정보에서 을 예측 하려고합니다 .(Z0,Z1,,Zn)(μ,μ,,μ)Σ(z1,z2,,zn) z0

  • 선형 은 계수 를 결정 하려면 예측이 형식을 취해야 함을 의미합니다 . 이러한 계수는 미리 알려진 내용, 즉 의 항목에 따라 크게 달라질 수 있습니다 .z0^=λ1z1+λ2z2++λnznλiΣ

이 예측 변수는 임의 변수 으로 간주 될 수도 있습니다 .Z0^=λ1Z1+λ2Z2++λnZn

  • Unbiased 는 의 기대치가 (알 수없는) 평균 와 같다는 것을 의미 합니다.Z0^μ

내용을 작성하면 계수에 대한 정보가 제공됩니다.

μ=E[Z0^]=E[λ1Z1+λ2Z2++λnZn]=λ1E[Z1]+λ2E[Z2]++λnE[Zn]=λ1μ++λnμ=(λ1++λn)μ.

두 번째 줄은 기대의 선형성 때문이며 나머지는 모두 대수학입니다. 이 절차는 값에 관계없이 작동한다고 가정하기 때문에 , 계수는 반드시 합산되어야합니다. 벡터 표기법 계수를 쓰면 깔끔하게 쓸 수 있습니다 .μλ=(λi)1λ=1

그러한 편향되지 않은 모든 선형 예측 변수 중에서 방 평균 제곱으로 측정 된 실제 값에서 최대한 벗어나는 것을 찾습니다 . 이것은 다시 계산입니다. 공분산의 이중선 성과 대칭에 의존하며, 두 번째 줄의 합산에 대한 적용은 다음과 같습니다.

E[(Z0^Z0)2]=E[(λ1Z1+λ2Z2++λnZnZ0)2]=i=1nj=1nλiλjvar[Zi,Zj]2i=1nλivar[Zi,Z0]+var[Z0,Z0]=i=1nj=1nλiλjΣi,j2i=1nλiΣ0,i+Σ0,0.

계수는이 2 차 형태를 최소화하여 (선형) 구속 조건 따라 얻을 수 있습니다 . 이것은 Lagrange multipliers 방법을 사용하여 쉽게 해결 되어 "Kriging equations" 라는 선형 방정식 시스템을 생성합니다 .1λ=1

본 출원에서, 는 공간 확률 프로세스 ( "random field")이다. 즉, 임의의 고정 위치가 아닌 임의의 고정 된 위치 에 대해 해당 위치 의 값 벡터 는 어떤 종류의 다변량 분포에 무작위입니다. 쓰고 모든 위치 에서 공정의 평균이 가정 하고 위의 분석을 적용합니다. 는 에서의 공정 값의 공분산 행렬을 가정 합니다. 곳의 위치는 확실하게 알려져 있습니다.Zx0,,xnZ(Z(x0),,Z(xn))Zi=Z(xi)n+1xin+1

이것을 해석하자. 가정 (상수 평균 및 알려진 공분산 포함)에서 계수는 선형 추정기로 얻을 수있는 최소 분산을 결정합니다. 이 차이를 ( "OK"는 "일반 크릭")입니다. 매트릭스 에만 의존 합니다. 에서 반복적으로 샘플링 하고이 계수를 사용하여 매번 나머지 값에서 값 을 예측하는 경우σOK2Σ(Z0,,Zn)z0

  1. 평균적으로 우리의 예측은 정확할 것입니다.

  2. 일반적으로, 우리의 예측 대한 벗어난 것 의 실제 값에서 .z0σOKz0

시간이 정확한 데이터로부터 표면을 추정하는 것과 같은 실제 상황에 적용될 수 있으려면 훨씬 더 많은 이야기가 필요합니다. 공간 프로세스의 통계적 특성이 지역마다 어떻게 다른지에 따라 어떻게 다른지에 대한 추가 가정이 필요합니다. 실제로는 일반적으로 하나의 실현 만 가능합니다). 그러나이 설명은 "최고의"편견없는 선형 예측 자 ( "BLUP")에 대한 검색이 선형 방정식 시스템으로 간단하게 이어지는 방법을 따르기에 충분해야합니다.


그건 그렇고, 일반적으로 수행되는 크릭은 최소 제곱 추정과 동일하지 않습니다. 는 동일한 데이터를 사용 하는 예비 절차 ( "변형 법"이라고 함)에서 추정 되기 때문 입니다. 이는 가 알려져 있다고 가정 한 (그리고 데이터 와 무관 한 포티 오리) 이 파생의 가정과 상반됩니다 . 따라서 처음부터 크 래깅에는 몇 가지 개념적 및 통계적 결함이 있습니다. 사려 깊은 개업의는 항상 이것을 알고 있었고 불일치를 정당화하기위한 다양한 창의적 방법을 발견했습니다. ( 많은 데이터가 있으면 실제로 도움이 될 수 있습니다.) 이제 를 동시에 추정하기위한 절차가 있습니다 . ΣΣΣ미지의 위치에서 값들의 집합을 예측하는 단계를 포함한다. 이 위업을 달성하기 위해서는 약간 더 강한 가정 (다변량 정규성)이 필요합니다.


사람들이 kriging에 반대하는 웹 사이트가 있으며 그가 유효한 점이있는 것 같습니다. 나는 당신의 마지막 단락이 매우 밝다고 생각합니다.
Wayne

@ Wayne 예, 내가 반응하는 것을 말할 수 있습니다. 그러나 kriging은 컨설턴트에 의해 "뱀 오일"로 사용되었지만, 매체의 작은 샘플에서 얻은 데이터와 훨씬 더 큰 데이터에서 얻은 데이터를 비교하는 "지원 변경"이론을 포함하여 많은 노력을 기울이고 있습니다. 그 매체의 일부. Kriging은 궁극적으로 오늘날 가장 정교한 시공간 모델링의 최하단에 있습니다. 대체 제안을 평가하는 유용한 방법이기도합니다. 예를 들어, 많은 공간 보간 기가 선형 (또는 선형화 될 수 있음)이므로 추정 분산과 크 래깅의 추정 분산을 비교하는 것이 공정합니다.
whuber

1

Kriging은 공간 데이터에 대한 최소 제곱 추정입니다. 따라서 제곱 오차의 합을 최소화하는 선형 편향 추정량을 제공합니다. 편향되지 않았기 때문에 MSE = 추정기 분산이며 최소값입니다.


kriging error를 계산하는 부분을 얻지 못했고 kriging variance와 variance와 혼동됩니다. 차이 무엇이며 그 중요성 무엇인가
user31820

@whuber. 설명에 감사하지만 편견없는 추정치와 실제 추정기로 예측 한 값의 MSE를 계산할 때 방정식 도출을 얻지 못했습니다. 그 방정식에 구체적으로 두 번째 줄
user31820

@ whuber 또한 귀하의 답변에있는 것과 비슷한 kriging 분산을 계산할 때 wiki 부분을 얻지 못했습니다. 결과는 같지만 초기 용어는 다릅니다. 어떻게 오세요?
user31820 2016 년
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.