혼란 스러울 때 문제를 말하고 하나씩 질문을하면서 시작하겠습니다. 표본 크기는 10,000이며 각 표본은 특징 벡터 설명됩니다 . 그러면 가우시안 방사 기저 함수를 이용하여 회귀 분석을 수행 할 경우, 폼의 기능을 찾고 F ( X ) = Σ J w J * g의 J ( X ; μ J , σ J ) , J = 1 ... m g의 난x∈R31
f(x)=∑jwj∗gj(x;μj,σj),j=1..m
gi기본 기능입니다. 구체적으로, 찾아야
가중치
w는 J 즉 주어진 파라미터 있도록
μ J 및
σ J 는과의 오차 최소화
Y 및 대응 예측
Y =
F ( X를 ) - 일반적으로는 최소 제곱 오차를 최소화한다.
mwjμjσjyy^f(x^)
Mu 아래 첨자 j 매개 변수는 정확히 무엇입니까?
기본 함수 g j 를 찾아야 합니다. (당신은 여전히 숫자를 결정해야 m를 각 기저 함수가있을 것이다) μ의 J 와 σ의 J (도 알 수없는). 아래 첨자 j 는 1 내지 m의 범위이다 .mgjmμjσjj1m
는 IS 벡터?μj
예, 의 요점입니다 . 다시 말해, 피쳐 공간 어딘가에있는 점 이며 각 m 기준 함수 에 대해 μ 를 결정해야합니다 .R31μm
이것이 기본 기능의 위치를 결정한다는 것을 읽었습니다. 이것이 뭔가의 의미가 아닙니까?
jthμj
이제 "공간 규모를 관장하는"시그마에 대해. 정확히 무엇입니까?
σ
R1R2R1σσσσσ
R1xgj(x)gj(x)gj(x)
각 기저 함수는 입력 벡터 x를 스칼라 값으로 변환
x∈R31
exp(−∥x−μj∥222∗σ2j)
결과적으로 스칼라를 얻습니다. 스칼라 결과는 의해 주어진 중심으로부터 지점의 거리에 따라 달라집니다 스칼라 입니다.xμj∥x−μj∥σj
이 매개 변수에 대해 .1, .5, 2.5와 같은 값을 시도하는 일부 구현을 보았습니다. 이 값들은 어떻게 계산됩니까?
이것은 물론 가우스 방사형 기저 함수를 사용하는 데있어 흥미롭고 어려운 측면 중 하나입니다. 웹을 검색하면 이러한 매개 변수가 어떻게 결정되는지에 대한 많은 제안을 찾을 수 있습니다. 매우 간단한 용어로 클러스터링을 기반으로 한 가지 가능성을 간략하게 설명하겠습니다. 이 제안과 다른 몇 가지 제안을 온라인에서 찾을 수 있습니다.
먼저 10000 개의 샘플을 클러스터링합니다 (먼저 PCA를 사용하여 차원을 줄이고 k- 평균 클러스터링을 수행 할 수 있음). 당신은 할 수 당신이 (일반적으로 가장 결정하기 위해 교차 유효성 검사를 사용 찾을 클러스터의 숫자 ). 이제 각 클러스터에 대해 방사형 기본 함수 를 만듭니다. 각 방사형 기저 함수에 대해 의 중심 (예 : 평균, 중심 등)으로합니다. 하자 (예를 들어 반경이 ...) 이제 가서 당신의 회귀를 수행하는 클러스터의 폭을 반영 (이 간단한 설명은 각 단계에서 많은 작업을 필요로 단지 개요 -입니다!)mmgjμjσj
* 물론 종 곡선은- 에서 로 정의 되므로 라인의 어느 곳에서나 값을 갖습니다. 그러나 중심에서 멀리 떨어진 값은 무시할 수 있습니다∞∞