방사형 기저 함수가 커널임을 증명하는 방법?


34

방사형 기저 함수 가 커널 임을 증명하는 방법 은 무엇입니까? 내가 이해하는 한, 이것을 증명하기 위해 우리는 다음 중 하나를 증명해야합니다.k(x,y)=exp(||xy||2)2σ2)

  1. 벡터 집합 행렬 = 은 양의 반정의입니다.x1,x2,...,xnK(x1,x2,...,xn)(k(xi,xj))n×n

  2. = 과 같은 매핑 가 제공 될 수 있습니다 .Φk(x,y)Φ(x),Φ(y)

어떤 도움?


1
더 명확하게 연결하기 위해 : 이 질문에서 기능 맵 , 특히 Taylor 시리즈와 광산 을 기반으로 한 Marc Claesen의 답변 은 RKHS와 Douglas가 제공 한 임베딩 의 일반 버전을 모두 설명 합니다. L2
Dougal

답변:


26

Zen은 방법 1을 사용했습니다. 방법 2 : 를 Hilbert 공간 에서 를 중심으로하는 구형 대칭 가우스 분포에 매핑 합니다. 이것이 올바르게 작동하려면 표준 편차와 상수 요소를 조정해야합니다. 예를 들어 한 차원에서xxL2

exp[(xz)2/(2σ2)]2πσexp[(yz)2/(2σ2)2πσdz=exp[(xy)2/(4σ2)]2πσ.

따라서 표준 편차 하고 가우스 분포를 조정하여 을 얻습니다 . 이 마지막 크기 조정 은 정규 분포 의 규범이 일반적으로 이 아니기 때문에 발생합니다 . K(X,Y)=Φ(X),Φ(Y)L(2)(1)σ/2k(x,y)=Φ(x),Φ(y)L21


2
@Zen, Douglas Zare : 훌륭한 답변에 감사드립니다. 공식 답변을 어떻게 선택해야합니까?
Leo

23

pd 커널을 만드는 것으로 알려진 일련의 일반적인 단계에서 커널을 빌드하는 것입니다. 는 아래 커널의 도메인을 나타내고 는 기능 맵을 보자 . φXφ

  • 스케일링 : 만약 하는 PD 커널, 그렇습니다 어떤 상수 .γ κ γ > 0κγκγ>0

    증명 : 가 의 기능 맵인 경우 는 의 유효한 기능 맵입니다 .κ φκγκγφγκ

  • 합계 : 만약 및 PD 커널입니다, 그래서이다 .κ 2 κ 1 + κ 2κ1κ2κ1+κ2

    증명 : 연결하여이 기능을 매핑 와 , 얻을 .φ 2 X [ φ 1 ( X ) φ 2 ( X ) ]φ1φ2x[φ1(x)φ2(x)]

  • 한계 : 경우 PD 커널하고있다 모두에 대해 존재 그리고, 는 pd입니다.κ1,κ2,κ(x,y):=limnκn(x,y)κx,yκ

    증명 : 각 및 모든 우리는 . 로 제한을 취하면 와 동일한 속성이 부여 됩니다.{ ( x i , c i ) } m i = 1X × R m i = 1 c i κ n ( x i , x j ) c j0 n κm,n1{(xi,ci)}i=1mX×Ri=1mciκn(xi,xj)cj0nκ

  • 제품 : 경우 및 PD 커널이다, 그래서이고 .κ 2 g ( x , y ) = κ 1 ( x , y )κ1κ2g(x,y)=κ1(x,y)κ2(x,y)

    증명 : 이것은 Schur 제품 정리 에서 즉시 따르지만 Schölkopf와 Smola (2002)는 다음과 같은 훌륭한 기본 증거를 제공합니다. 하자 는 독립적입니다. 따라서 공분산 행렬은 psd 여야하므로 의 공분산 행렬이 이를 증명한다는 사실을 증명합니다. C o v ( V i W i , V j W j ) = C o v ( V i , V j )

    (V1,,Vm)N(0,[κ1(xi,xj)]ij)(W1,,Wm)N(0,[κ2(xi,xj)]ij)
    Cov(ViWi,VjWj)=Cov(Vi,Vj)Cov(Wi,Wj)=κ1(xi,xj)κ2(xi,xj).
    (V1W1,,VnWn)
  • 파워 : 만약 되는 PD 커널 그렇다 양의 정수 .κκn(x,y):=κ(x,y)nn

    증명 : "제품"속성에서 즉시.

  • 지수 : 만약 되는 PD 커널 그렇다 .κeκ(x,y):=exp(κ(x,y))

    증명 : ; "powers", "scalings", "sums"및 "limits"속성을 사용하십시오.eκ(x,y)=limNn=0N1n!κ(x,y)n

  • 함수 : 만약 되는 PD 커널 , 물론이다.κf:XRg(x,y):=f(x)κ(x,y)f(y)

    증명 : 기능 맵 .xf(x)φ(x)

이제 선형 커널로 ​​시작 , 로 "크기 조정"적용, "지수"적용 및 "함수"적용 .

k(x,y)=exp(12σ2xy2)=exp(12σ2x2)exp(1σ2xTy)exp(12σ2y2).
κ(x,y)=xTy1σ2xexp(12σ2x2)

22

방법 1을 사용하겠습니다. 방법 2를 사용한 증명에 대해서는 Douglas Zare의 답변을 확인하십시오.

가 실수 인 경우를 증명할 것이므로 입니다. 일반적인 경우 는 동일한 주장에서 돌연변이 를 따르며 수행 할 가치가 있습니다.x,yk(x,y)=exp((xy)2/2σ2)

일반성을 잃지 않고 이라고 가정하십시오 .σ2=1

쓰십시오 . 여기서 랜덤 변수의 특성 함수 와 분포.k(x,y)=h(xy)

h(t)=exp(t22)=E[eitZ]
ZN(0,1)

실수 및 경우 그 수반되는 양의 함수 semidefinite 일명 커널이다.x1,,xna1,,ank

j,k=1najakh(xjxk)=j,k=1najakE[ei(xjxk)Z]=E[j,k=1najeixjZakeixkZ]=E[|j=1najeixjZ|2]0,
k

이 결과를보다 일반적으로 이해하려면 Bochner Theorem ( http://en.wikipedia.org/wiki/Positive-definite_function)을 확인하십시오 .


2
이 두 가지주의하여 오른쪽 방향으로, 좋은 시작이다 : (a) (지수의 부호를 확인) 도시 기대 같지 않은 케이스 여기서주의를 제한하는 (b)이 나타날 와 는 스칼라이며 벡터가 아닙니다. 그 동안 박람회는 훌륭하고 깨끗했기 때문에 이러한 격차를 빨리 막을 것이라고 확신합니다. :-)X Yh(t)xy
추기경

1
Tks! 나는 서두르고 있습니다. :-)
Zen

1
실례합니다, 여기서 어떻게 돌연변이를 관리하는지 모르겠습니다. 형식으로 전달하기 전에 표준을 개발하면 제품이 생겨 제품과 합계를 교환 할 수 없습니다. 그리고 나는 단순히 h 형식으로 전달한 후 좋은 표현을 얻기 위해 표준을 개발하는 방법을 보지 못합니다. 당신은 저를 조금 이끌 수 있습니까? :)h
Alburkerk
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.