가우스 커널의 기능 맵


24

SVM에서 가우스 커널은 다음과 같이 정의됩니다. 여기서 x, y \ in \ mathbb {R ^ n} 입니다. \ phi 의 명시 적 방정식을 모른다 . 알고 싶습니다.x,yRnϕ

K(x,y)=exp(xy222σ2)=ϕ(x)Tϕ(y)
x,yRnϕ

또한

iciϕ(xi)=ϕ(icixi)
여기서 c_i \ in \ mathbb R 인지 알고 싶습니다 ciR. 커널을 사용하면 선형 클래스가 작동하지 않는 상황을 처리하기 때문에 같지 않다고 생각합니다. 나는 ϕ x를 무한한 공간에 투영한다는 것을 알고 있습니다. 따라서 치수가 몇 개이든 관계없이 여전히 선형으로 유지된다면 svm은 여전히 ​​좋은 분류를 할 수 없습니다.

이 커널은 왜 변환을 의미합니까? 또는 연관된 피처 공간을 참조하고 있습니까?
Placidia

예, 특징 공간은 무엇인가 ϕ() 그래서 ϕT(x)ϕ(x)=exp(12σ2xx2)
user27886

답변:


20

e ^ x 의 Tailor series 확장을 통해 가우스 커널에 대한 명시적인 \ phi 방정식을 얻을 수 있습니다 . 표기법의 단순화를 위해 x \ in \ mathbb {R} ^ 1을 가정하십시오 .ϕexxR1

ϕ(x)=ex2/2σ2[1,11!σ2x,12!σ4x2,13!σ6x3,]T

이것은 또한 NTU의 Chih-Jen Lin (슬라이드 11)에 의해이 슬라이드 에서 더 자세히 논의됩니다 . 슬라이드에서 γ=12σ2 가 커널 매개 변수로 사용됩니다.

OP의 방정식은 선형 커널에만 적용됩니다.


2
안녕, 그러나 위의 방정식은 한 차원에만 적합합니다.
Vivian

자, 여기서 재생 커널 힐버트 공간은 의 하위 공간입니다 . 맞습니까? 2
The_Anomaly

Laplacian 커널에 대한 명시적인 표현이 있습니까?
Felix Crazzolara

13

유효한 psd 커널 에는 와 같은 기능 맵 입니다. 공간 와 포함 는 실제로 고유 할 필요는 없지만 재생 커널 힐버트 공간 (RKHS)으로 알려진 중요한 고유 쌍 있습니다. φ : XH의 K ( X , Y ) = φ ( X ) , φ ( Y ) H H φ ( H , φ )k:X×XRφ:XHk(x,y)=φ(x),φ(y)HHφ(H,φ)

RKHS는 Steinwart, Hush and Scovel, 가우스 RBF 커널의 재현 커널 힐버트 공간에 대한 명시 적 설명 , IEEE 정보 이론에 관한 트랜잭션 2006 ( doi , free citeseer pdf )에 의해 논의 됩니다.

다소 복잡하지만 다음과 같이 요약됩니다. 를 e n ( z ) : = en:CC

en(z):=(2σ2)nn!zneσ2z2.

하자 모두에 이르기까지 연속 수 음수가 아닌 정수로 -tuples; 인 경우 , 아마도 , , 등입니다. 번째 튜플 의 번째 구성 요소를 나타냅니다 . d d = 3 n ( 0 ) = ( 0 , 0 , 0 ) n ( 1 ) = ( 0 , 0 , 1 ) n ( 2 ) = ( 0 , 1 ,n:N0N0ddd=3n(0)=(0,0,0)n(1)=(0,0,1)j i N I Jn(2)=(0,1,1)jinij

그런 다음 의 번째 구성 요소 는 입니다. 따라서 는 벡터를 무한 차원 복소수 벡터에 매핑 합니다.φ ( x ) d j = 1 e n i jiφ(x)φ R dj=1denij(xj)φRd

이를 위해 우리는 이러한 무한 차원 복소 벡터에 대한 규범을 특별한 방식으로 정의해야합니다. 자세한 내용은 논문을 참조하십시오.


Steinwart et al. 또한 에서 사각형 통합 함수의 Hilbert 공간 인 에 더 간단하게 (내 생각에) 임베드합니다 : 참고 그 자체에서 함수 에 . 기본적으로 평균 와 공분산 을 갖는 차원 가우스 밀도입니다. ; 정규화 상수 만 다릅니다. 따라서 우리가 걸릴 때 R dRL2(Rd)RdRΦσ(X)RD

Φσ(x)=(2σ)d2πd4e2σ2x22.
Φσ(x)RdRdxΦ(X),Φ(Y)14σ2It k ( x , y )
Φ(x),Φ(y)L2=[Φ(x)](t)[Φ(y)](t)dt,
우리는 Gaussian 밀도 함수곱을 취하고 있는데, 그 자체는 일정한 상수 곱하기 Gaussian 밀도 함수입니다. 적분을 수행하면 빠지는 상수는 정확히 입니다.tk(x,y)

이것 만이 작동하는 것은 아닙니다.

또 다른 하나는 푸리에 변환 (Fourier Transform)을 기반으로하며 , 유명한 Rahimi and Recht ( 대규모 커널 머신의 랜덤 기능 , NIPS 2007) 논문 은 큰 효과를 거두었습니다.

또한 테일러 시리즈를 사용하여 수행 할 수 있습니다 : 효과적으로 Cotter, Keshet 및 Srebro의 무한 버전 , 가우스 커널의 명시 적 근사 , arXiv : 1109.4603 .


1
더글러스 Zare는 흥미로운 스레드에서 내장은 "더 간단"의 1D 버전 준 여기를 .
Dougal

여기서는 가 무한한 훈련 샘플의 경우에도 훈련 샘플의 크기와 동일한 차원의 스페 이브에 매핑 될 수 있다는보다 '직관적 인'설명을 찾을 수 있습니다. stats.stackexchange.com/questions/80398/…Φ

6

선형 매핑 인 경우에만 두 번째 방정식이 참처럼 보입니다 (따라서 는 선형 커널입니다). 가우시안 커널은 비선형이므로, 평등은 유지되지 않습니다 (아마도 가 0이 되는 한계를 제외하고 ).K σϕKσ


답변 주셔서 감사합니다. 때 , 가우시안 커널 프로젝트의 크기가 증가 할 것입니다. 그리고 당신의 영감에 의해, 나는 그것이 같지 않다고 생각합니다. 커널을 사용하면 선형 분류가 작동하지 않는 상황을 처리하기 때문입니다. σ0
Vivian
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.