ep-SVR과 nu-SVR의 차이 (최소 제곱 SVR)

11

그런 종류의 데이터에 적합한 SVR을 찾으려고합니다.

SVR의 4 가지 유형을 알고 있습니다.

엡실론
뉴
최소 제곱
선의.

선형 SVR이 L1 Reg의 올가미와 비슷하다는 것을 이해하지만 나머지 3 가지 기술의 차이점은 무엇입니까?

regression svm

11

에서 -svr, 매개 변수 당신이 데이터 세트의 샘플의 총 수에 대한 솔루션을 유지하고자 지원 벡터의 수의 비율을 결정하는 데 사용됩니다. 에서 -svr 매개 변수 최적화 문제 제형에 도입하고, 자동 (최적) 당신을 위해 추정된다. $\nu$ $\nu$ $\nu$ $\epsilon$

그러나 -SVR에서는 데이터 세트에서 지원 벡터가되는 데이터 벡터 수를 제어 할 수 없으며 몇 개일 수도 있고 여러 개일 수도 있습니다. 그럼에도 불구하고 모델에 허용되는 오류의 양을 완전히 제어 할 수 있으며 지정된 이외의 항목 은 정규화 매개 변수 인 에 비례하여 불이익을받습니다 . $\epsilon$ $\epsilon$ $C$

내가 원하는 것에 따라 두 가지 중에서 선택합니다. 나는 작은 솔루션 (이하 지원 벡터) 정말 필사적 경우 나는 선택 -svr과 희망 괜찮은 모델을 얻을 수는. 그러나 실제로 모델의 오류 양을 제어하고 최상의 성능을 얻으려면 -SVR을 선택 하고 모델이 너무 복잡하지 않기를 바랍니다 (많은 지원 벡터). $\nu$ $\epsilon$

— 파블로 리 바스
소스

5

사이의 차이 -svr 및 -svr는 교육 문제가 매개 변수화하는 방법이다. 둘 다 비용 함수에서 힌지 손실 유형을 사용합니다. -SVM 의 매개 변수를 사용하여 결과 모델에서 지원 벡터의 양을 제어 할 수 있습니다. 적절한 매개 변수가 주어지면 동일한 문제가 해결됩니다. ¹ $\epsilon$ $\nu$ $\nu$ $\nu$

최소 제곱 SVR은 비용 함수에서 힌지 손실 대신 제곱 잔차를 사용하여 다른 두 가지와 다릅니다.

¹ : C.-C. Chang and C.-J. 린 교육 지원 벡터 회귀 : 이론 및 알고리즘 $\nu$ . 신경 계산, 14 (8) : 1959-1977, 2002.

— 마크 클라 센
소스

답변 해 주셔서 감사합니다. Marc. 그렇다면 우리가 보유한 데이터 세트를 기반으로 적합한 방법을 구별 할 수 있습니까? 그렇다면 몇 가지 조언을 해 주시겠습니까? 200 개의 고유 한 출력을 가진 40000 개의 샘플이 있습니다. 따라서 200 개의 고유 한 샘플 200 개로 생각할 수 있습니다. 모든 40000에 대한 입력은 다르지만 출력은 200 개의 샘플에 대해 고유합니다.

— Sharath Chandra

0

나는 파블로와 마크의 대답을 모두 좋아한다. 한 가지 추가 사항 :

Marc가 인용 한 논문에는 다음과 같이 쓰여 있습니다 (섹션 4).

" SVR 의 동기는 매개 변수를 결정하기가 쉽지 않다는 것 입니다. 따라서 여기서 우리는 가능한 범위에 관심이 있습니다 . 예상대로 결과는 이 목표 값과 관련되어 있음을 보여줍니다 . $\nu$ $\epsilon$ $\epsilon$ $\epsilon$ $y$

[...]

의 유효 범위가 목표 값 영향을 받기 때문에 -SVM의 이러한 어려움을 해결하는 방법 은 데이터를 학습하기 전에 목표 값을 조정하는 것입니다. 모든 목표 값을 확장하는 경우, 예를 들어, 다음의 유효 범위 것 의 동일한 . 그러면 을 선택하는 것이 더 쉬울 수 있습니다 . " $\epsilon$ $y$ $\epsilon$ $[-1,+1]$ $\epsilon$ $[0, 1]$ $\nu$ $\epsilon$

따라서 또는 SVR 사용 여부를 결정하는 것보다 대상 변수를 확장하고 -SVR을 사용하는 것이 더 쉬울 것이라고 생각하게되었습니다 . $\epsilon$ $\epsilon -$ $\nu -$

어떻게 생각해?

— spec3
소스