커널 릿지 회귀 효율


11

릿지 회귀는 여기서 는 예측 된 레이블입니다. , , 매트릭스를 식별 우리가 레이블을 찾기 위해 노력하고있는 객체와 의 매트릭스 객체 :

y^=(XX+aId)1Xx
y^Idd×dxXn×dnxi=(xi,1,...,xi,d)Rd

X=(x1,1x1,2x1,dx2,1x2,2x2,dxn,1x1,2xn,d)

우리는 이것을 다음과 같이 커널화할 수 있습니다 :

y^=(K+aId)1k

여기서 K 은 IS n×n 커널 함수 행렬 K

K=(K(x1,x1)K(x1,x2)K(x1,xn)K(x2,x1)K(x2,x2)K(x2,xn)K(xn,x1)K(xn,x2)K(xn,xn))

\ mathbf {K} n \ 시간 1 커널 함수의 열 벡터 Kkn×1K

k=(K(x1,x)K(x2,x)K(xn,x))

질문 :

(a)에 더 많은 개체가있는 경우 크기보다 그것을 이해가 수행 하지 커널을 사용합니까? 예를 들어 를 행렬로 설정 한 다음 는 되고 대신 행렬을 반전 시킵니다. 행렬은 커널을 사용하는 것이 었습니다. 이것은 커널을 사용해서는 안된다는 것을 의미합니까 ?xiX50×3XX3×33×350×50dn

(b) 가장 간단한 커널을 사용해야합니까? 능선 회귀 분석의 커널은 차원의 영향을 무효화하고 (지원 벡터 시스템과 달리) 피처 공간의 특정 속성을 사용하지 않는 데 사용됩니다. 커널이 객체 사이의 거리를 바꿀 수 있기 때문에 능선 회귀에 자주 사용되는 커널이 있습니까?

(c) 능선 회귀 및 / 또는 커널 능선 회귀 의 시간 복잡성은 무엇입니까?O


'효율'은 통계에서 다른 의미를 갖습니다. '계산 복잡성'을 의미 했습니까? (제목)
Memming

나는 "알고리즘 효율"을 의미했다. 내 질문에 의해 이것을 "계산의 복잡성"으로 줄여주는 것은 사실입니다.
Helix

답변:


5

(a) 커널을 사용하는 목적은이 경우 비선형 회귀 문제를 해결하는 것입니다. 좋은 커널을 사용하면 무한 차원의 피처 공간에서 문제를 해결할 수 있습니다. 그러나 선형 커널 를 사용하고 이중 공간에서 커널 릿지 회귀를 수행하는 것은 원시 공간에서 문제를 해결하는 것과 같습니다. 즉, 이점이 없습니다 (관찰에 따라 샘플 수가 증가함에 따라 속도가 훨씬 느려집니다).K(x,y)=xy

(b) 가장 인기있는 선택 중 하나는 제곱 지수 커널 인 범용 () REF 아래 참조. 많은 커널이 있으며 각각의 커널은 기능 공간에 대해 다른 내부 제품 (및 미터법)을 유도합니다.K(x,y)=exp(τ2||xy||2)

(c) 간단한 구현을 위해서는 크기 의 선형 방정식을 푸는 것이 필요 하므로 입니다. Nyström 근사법과 같은 더 빠른 근사법이 많이 있습니다. 이것은 활발한 연구 분야입니다.nO(n3)

참고 문헌 :

  1. Bharath Sriperumbudur, Kenji Fukumizu 및 Gert Lanckriet. 보편성, 특징적인 커널 및 RKHS 측정의 관련성. 기계 학습 연구 저널, 9 : 773–780, 2010.
  2. 베른하르트 슐 코프, 알렉산더 J. 스 몰라 커널을 이용한 학습 : 벡터 머신 지원, 정규화, 최적화 및 2002 년 이후
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.