답변:
에서 -svr, 매개 변수 당신이 데이터 세트의 샘플의 총 수에 대한 솔루션을 유지하고자 지원 벡터의 수의 비율을 결정하는 데 사용됩니다. 에서 -svr 매개 변수 최적화 문제 제형에 도입하고, 자동 (최적) 당신을 위해 추정된다.ν ν ϵ
그러나 -SVR에서는 데이터 세트에서 지원 벡터가되는 데이터 벡터 수를 제어 할 수 없으며 몇 개일 수도 있고 여러 개일 수도 있습니다. 그럼에도 불구하고 모델에 허용되는 오류의 양을 완전히 제어 할 수 있으며 지정된 이외의 항목 은 정규화 매개 변수 인 에 비례하여 불이익을받습니다 .ϵ C
내가 원하는 것에 따라 두 가지 중에서 선택합니다. 나는 작은 솔루션 (이하 지원 벡터) 정말 필사적 경우 나는 선택 -svr과 희망 괜찮은 모델을 얻을 수는. 그러나 실제로 모델의 오류 양을 제어하고 최상의 성능을 얻으려면 -SVR을 선택 하고 모델이 너무 복잡하지 않기를 바랍니다 (많은 지원 벡터).ϵ
사이의 차이 -svr 및 -svr는 교육 문제가 매개 변수화하는 방법이다. 둘 다 비용 함수에서 힌지 손실 유형을 사용합니다. -SVM 의 매개 변수를 사용하여 결과 모델에서 지원 벡터의 양을 제어 할 수 있습니다. 적절한 매개 변수가 주어지면 동일한 문제가 해결됩니다. 1ν ν ν
최소 제곱 SVR은 비용 함수에서 힌지 손실 대신 제곱 잔차를 사용하여 다른 두 가지와 다릅니다.
1 : C.-C. Chang and C.-J. 린 교육 지원 벡터 회귀 : 이론 및 알고리즘 . 신경 계산, 14 (8) : 1959-1977, 2002.
나는 파블로와 마크의 대답을 모두 좋아한다. 한 가지 추가 사항 :
Marc가 인용 한 논문에는 다음과 같이 쓰여 있습니다 (섹션 4).
" SVR 의 동기는 매개 변수를 결정하기가 쉽지 않다는 것 입니다. 따라서 여기서 우리는 가능한 범위에 관심이 있습니다 . 예상대로 결과는 이 목표 값과 관련되어 있음을 보여줍니다 .
[...]
의 유효 범위가 목표 값 영향을 받기 때문에 -SVM의 이러한 어려움을 해결하는 방법 은 데이터를 학습하기 전에 목표 값을 조정하는 것입니다. 모든 목표 값을 확장하는 경우, 예를 들어, 다음의 유효 범위 것 의 동일한 . 그러면 을 선택하는 것이 더 쉬울 수 있습니다 . "
따라서 또는 SVR 사용 여부를 결정하는 것보다 대상 변수를 확장하고 -SVR을 사용하는 것이 더 쉬울 것이라고 생각하게되었습니다 .
어떻게 생각해?