Matérn 공분산 함수의 이론적 근거는 무엇입니까?


19

Matérn 공분산 함수는 일반적으로 가우시안 프로세스에서 커널 함수로 사용됩니다. 이렇게 정의되어 있습니다

Cν()=σ221νΓ(ν)(2νρ)ν케이ν(2νρ)

여기서 는 거리 함수 (예 : 유클리드 거리), Γ 는 감마 함수, 케이ν 는 수정 된 제 2 종 베셀 함수, ρν 는 양수 매개 변수입니다. ν3 으로 선택된 많은 시간입니다32 또는52실제로 2 입니다.

이 커널은 표준 가우시안 커널보다 '부드럽 지 않기'때문에 더 잘 작동하지만 그 외에는이 커널을 선호하는 다른 이유가 있습니까? 그것이 어떻게 동작하는지에 대한 기하학적 직관이나 겉보기에 복잡한 공식에 대한 설명은 높이 평가 될 것입니다.

답변:


18

@DahnJahn 좋은 답변 외에도 Bessel 및 감마 기능의 출처에 대해 조금 더 이야기하려고 생각했습니다. 공분산 함수에 도달하기위한 시작점은 Bochner 정리입니다.

정리 (Bochner) 연속 고정 함수 k(x,y)=k~(|xy|) 한정된 양의 경우에만, k~ 푸리에 한정된 양의 측정 변환된다

k~(t)=Reiωtdµ(ω)

이것으로부터 Matérn 공분산 행렬이 1의 푸리에 변환으로 도출 된 것으로 추론 할 수 있습니다1(1+ω2)p (소스) . 그것은 모두 좋지만 실제로 당신이 주어진이 유한 한 긍정적 인 척도에 어떻게 도달하는지 알려주지 않습니다 . 그것은 확률 론적 과정의 (힘) 스펙트럼 밀도입니다.1(1+ω2)p.f(x)

어떤 확률 적 프로세스? Matérn 공분산 함수를 사용하는 의 랜덤 프로세스 는 확률 적 부분 미분 방정식 (SPDE) ( κ 2) α / 2 X ( s ) = φ W ( s ) 에 대한 해입니다. 여기서 W ( s) ) 는 단위 분산, Δ = d i = 1 인 가우스 백색 잡음입니다.Rd

(κ2)α/2X(s)=φW(s),
W(s) 는 Laplace 연산자이고α=ν+d/2입니다(이것은Cressie and Wikle입니다).
Δ=i=1d2xi2
α=ν+d/2

왜이 특정 SPDE / 스토 차 스틱 프로세스를 선택해야합니까? 기원은 공간 통계에 있으며 에서 가장 잘 작동하는 가장 단순하고 자연스러운 공분산이라고 주장합니다 .R2

지수 상관 함수는 Markov 프로세스에 해당하기 때문에 1 차원의 자연 상관 관계입니다. 지수는 지리 통계 작업에서 일반적인 상관 함수이지만 2 차원에서는 더 이상 그렇지 않습니다. Whittle (1954)은 Laplace 유형의 확률 미분 방정식에 해당하는 상관 관계를 결정했습니다.

여기서

[(t1)2+(t2)2κ2]X(t1,t2)=ϵ(t1,t2)
는 백색 잡음입니다. 해당 이산 격자 프로세스는 2 차 자동 회귀입니다. (출처)ϵ

Matern 방정식과 관련된 SDE에 포함 된 공정 군에는 Brownian 운동을받는 입자의 속도에 대한 Ornstein-Uhlenbeck 모델이 포함됩니다. 더 일반적으로, 모든 정수에 대해 A R ( p ) 프로세스 계열에 대한 전력 스펙트럼을 정의 할 수AR(1)AR(p)Matérn 계열 공분산이있는 p에. 이것은 Rasmussen과 Williams의 부록에 있습니다.p

이 공분산 함수는 Matérn 클러스터 프로세스와 관련이 없습니다.

참고 문헌

Cressie, Noel 및 Christopher K. Wikle. 시공간 데이터에 대한 통계. 존 와일리 & 아들, 2015.

Guttorp, Peter 및 Tilmann Gneiting. "확률과 통계의 역사에 관한 연구들 XLIX On the Matern correlation family." Biometrika 93.4 (2006) : 989-995.

Rasmussen, CE 및 Williams, 기계 학습을위한 CKI 가우스 프로세스. MIT Press, 2006.


2
일차원 경우 형상과 Matern 공분산 , P 는 양의 정수가있는 연속적인 시간 회귀 과정이다 CAR ( P ) 순서의 P . 그러나 모든 CAR ( p ) 모델이 Matern 공분산을 갖는 것은 아닙니다. ν=p1/2pCAR(p)pCAR(p)
이브

그것은 내 입장에서 명백한 오해이며, 대답을 업데이트 할 것입니다. 감사합니다!
MachineEpsilon

16

나는 모른다. 그러나 나는이 질문이 매우 흥미로웠다는 것을 알았다. 그리고 여기에 약간의 독서 후에 얻은 것이있다.

νν=5/2

C5/2(d)=σ2(1+5dρ+5d23ρ2)exp(5dρ)
νCν
limνCν(d)=σ2exp(d22ρ2)
ν=1/2
C1/2(d)=σ2exp(dρ)

νν1 합니다.

이것은 Rasmussen & Williams (2006) 에서 찍은 사진에서 아주 잘 입증되었습니다. CE Rasmussen & CKI Williams, 기계 학습을위한 가우스 프로세스, MIT Press, 2006, ISBN 026218253X.  c 2006 매사추세츠 공과 대학.  www.GaussianProcess.org/gpml

에서는 공간 데이터 보간 (실제로 Matérn 공분산 함수의 이름을 제안) 스테인 주장 (PG. 30) 가우시안 공분산 함수의 무한한 미분 가능성은 단지 작은 연속 부분을 관찰하기 때문에, 물리적 인 처리를위한 비현실적인 결과를 얻을 수 있다는 공간 / 시간은 이론적으로 전체 기능을 산출해야합니다. 따라서 그는 물리적 프로세스를보다 현실적으로 일치시킬 수있는 일반화로 Matérn 버전을 제안했습니다.

요약

ν ) 있습니다.

ν


1
(+1) Matérn의 책 pub.epsilon.slu.se/10033/1/… 에서이 공분산 함수에 대한 설명이나 파생이 있는지 궁금합니다 . 나는 지금까지 그것을 찾을 수 없었습니다. 이 공분산 함수는 Stein의 책에서 매우 눈에 띄는 것처럼 보이므로 더 알고 싶습니다.
MachineEpsilon

@ Machineepsilon은 Matérn이 실제로 기능을 언급 / 정의합니까? 나는 Stein의 책에서 그가 그것을 생각 해낸 사람이라는 느낌을 얻었고 Matérn의 이름을 따서 명명했습니다.
Dahn

확실하지 않습니다. 그것이 내가 알고 싶었던 것입니다! Rasmussen도이 책을 참조하기 때문에 살펴 봐야합니다.
MachineEpsilon
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.