Kriging을 사용하여 일부 주변 변수를 기반으로 일부 변수의 값을 예측 해야하는 문제를 연구 중입니다. 직접 코드를 구현하고 싶습니다. 그래서 나는 그것이 어떻게 작동하는지 이해하기 위해 너무 많은 문서를 겪었지만 너무 혼란 스러웠습니다. 일반적으로 가중 평균이라는 것을 이해하지만 가중치 계산 프로세스를 완전히 이해하지 못하고 변수 값을 예측할 수 없었습니다.
이 보간법의 수학적 측면과 작동 방식을 간단한 용어로 설명해 주시겠습니까?
Kriging을 사용하여 일부 주변 변수를 기반으로 일부 변수의 값을 예측 해야하는 문제를 연구 중입니다. 직접 코드를 구현하고 싶습니다. 그래서 나는 그것이 어떻게 작동하는지 이해하기 위해 너무 많은 문서를 겪었지만 너무 혼란 스러웠습니다. 일반적으로 가중 평균이라는 것을 이해하지만 가중치 계산 프로세스를 완전히 이해하지 못하고 변수 값을 예측할 수 없었습니다.
이 보간법의 수학적 측면과 작동 방식을 간단한 용어로 설명해 주시겠습니까?
답변:
이 답변은 "Universal Kriging"(영국)의 (가장 현대적인) 시공간 확장을 설명하는 논문을 위해 최근에 쓴 입문 섹션으로 구성되어 있으며, 그 자체는 "Ordinary Kriging"의 일반화입니다. 세 가지 하위 섹션이 있습니다. 이론 은 통계 모델과 가정을 제공합니다. 추정 은 최소 제곱 모수 추정을 간단히 검토합니다. 및 예측 쇼에서는 일반화 된 최소 제곱 (GLS) 프레임 워크에 맞는을 크리깅. 통계 전문가, 특히이 사이트 방문자에게 친숙한 표기법을 채택하고 여기에 잘 설명 된 개념을 사용하려고 노력했습니다.
요약하면 kriging은 랜덤 필드의 BLUP (Best Linear Unbiased Prediction)입니다. 이는 샘플링되지 않은 위치에서 예측 된 값이 샘플링 된 위치에서 관찰 된 값과 공변량의 선형 조합으로 얻어 짐을 의미합니다. (알 수없는 임의의) 값은 샘플 값과 상관 관계가 있다고 가정합니다 (샘플 값은 서로 연관되어 있음). 이 상관 정보는 예측의 분산으로 쉽게 변환됩니다. 예측에서 제로 바이어스 조건에 따라이 편차를 가능한 작게 만드는 선형 조합 ( "크릭 가중치")의 계수를 선택합니다. 자세한 내용은 다음과 같습니다.
영국은 연구 영역에 대한 GLS 모델의 맥락에서 수행되는 두 가지 절차 (추정 중 하나와 예측 중 하나)로 구성됩니다. GLS 모델 전제로 샘플 데이터 것을 경향 주위 랜덤 편차의 결과와 그 편차는 상관 관계가있다. 경향은 p의 미지수 계수 (매개 변수) β = ( β 1 , β 2 , … , β 의 선형 조합에 의해 결정될 수있는 값의 일반적인 의미로 의미된다 . (이 글 전체에서 프라임 ' 이고 전치 행렬, 모든 벡터는 칼럼 벡터로 간주한다.)
연구 지역 내의 임의의 위치에 수치 속성 가능한 튜플가 '독립 변수 '또는 불리는 "을 공변량." (일반적으로 y 1 = 1 은 "일정한 항"이며, y 2 및 y 3 은 공간 좌표 일 수 있으며 추가 y i물론 이러한 펌핑 대수층 또는 거리의 기공율로 학습 영역에서 모든 위치에 사용할 공간 정보 및 다른 부가 정보를 나타낼 수있다.) 각 데이터 위치 그 공변량 외에 Y 난 = ( y i 1 , y i 2 , … , y i p ) ' 에서 관련 관측 값 z i 는 랜덤 변수 Z i 의 실현으로 간주됩니다 . 대조적으로, y i는 관측치에 의해 표현 된 점들 또는 작은 영역들 (데이터 "지지들")에 의해 결정되거나 특성화되는 값들로 생각된다. 확률 변수의 실현되는 것으로 간주되지 않으며 임의의 특성과 무관 할 필요 Z의 I .
선형 조합 는 매개 변수 β 와 관련하여 Z i 의 예상 값을 나타냅니다 . 위치 i 에서의 추세 값 . 추정 과정은 값을 찾기 위해 데이터를 사용하여 β I를 미지 매개 변수가 나타내는 β I을
고전적인 크 래깅은 랜덤 변동 가 0의 예상 값을 가지고 공분산이 알려져 있다고 가정합니다 . Z i 와 Z j 사이의 공분산 을 c i j 로 씁니다 . 이 공분산을 사용하여 추정은 GLS를 사용하여 수행됩니다. : 그 해결책은 다음과 같다 β = H의 Z , H = ( Y ' C - 1 Y ) - 1 Y는 ' C - 1 여기서, Z = ( Z 1
UK 마찬가지로 예측 데이터의 선형 결합에 의해 Z 0 = λ 1 Z 1 + λ (2) (Z) 2 + ⋯ + λ N Z N = λ ' Z . λ 난 의 예측을위한 "클리 깅 가중치"라고 Z 0 . UK는 이러한 예측을 수행 Z 0 개의 조건을 충족시키는 것을들 수있다. 먼저, 예측은 편향되지 않아야하며, 이는 랜덤 변수의 선형 조합을 요구함으로써 표현됩니다.
(다중 회귀에 익숙한 독자는이 솔루션을 공칭 기반 최소 제곱 법선 의 공분산 기반 솔루션과 비교하는 것이 도움이 될 수 있습니다.이 방정식 은 거의 동일하지만 Lagrange 승수 항이 없습니다.