비선형으로 분리 가능한 데이터에 대해 선형 SVM을 교육하면 어떻게됩니까?


11

비선형으로 분리 가능한 데이터에 대해 기본 지원 벡터 머신 (선형 커널 및 소프트 마진 없음)을 훈련하면 어떻게됩니까? 최적화 문제는 실현 가능하지 않으므로 최소화 알고리즘은 무엇을 반환합니까?

답변:


11

기본 지원 벡터 머신은 하드 마진 SVM을 의미한다고 생각합니다. 자, 검토해 봅시다 :

어려운 여백 SVM 이란 무엇입니까

요컨대, 훈련 표본 공간에서 모든 관측 값을 올바르게 분리 할 수있는 가장 큰 마진을 가진 초평면을 찾고자합니다.

하드 마진 SVM의 최적화 문제

위의 정의가 주어지면 해결해야 할 최적화 문제는 무엇입니까?

  1. 최대 마진 초평면 : 우리는 원한다 max(margin)
  2. 정확하게 모든 관측치를 분리 할 수 있어야한다 : 우리는 최적화해야 margin하고 또한 제약 조건을 만족 없음을에서 샘플 오류

비선형으로 분리 가능한 데이터에 대해 선형 SVM을 교육하면 어떻게됩니까?

질문으로 돌아가서, 특징 변환없이 하드 마진 SVM을 사용하여 학습 데이터 세트를 선형으로 분리 할 수 ​​없다고 언급 했으므로 "샘플링 오류 없음"을 만족하는 하이퍼 플레인을 찾는 것은 불가능합니다 .

일반적으로 우리는 Quadratic Programming으로 SVM 최적화 문제를 해결합니다. 제약 조건으로 최적화 작업을 수행 할 수 있기 때문입니다. 하드 마진 SVM의 제약 조건을 충족시키지 않고 Gradient Descent 또는 기타 최적화 알고리즘을 사용하는 경우에도 결과가 발생하지만 하드 마진 SVM 하이퍼 플레인은 아닙니다.

그건 그렇고, 비선형 적으로 분리 가능한 데이터로 보통

  • 하드 마진 SVM + 기능 변환
  • 소프트 마진 SVM을 직접 사용하십시오 (실제로 소프트 마진 SVM은 일반적으로 좋은 결과를 얻습니다)

답변 주셔서 감사합니다. 따라서 R 또는 Python의 SVM 패키지는 데이터가 비선형 적으로 분리 가능할 때 2 차 프로그래밍 방법을 사용하지 않습니까?
SVM

어떤 svm 라이브러리를 사용하는지 잘 모르겠습니다. 나는 libsvm을 사용하고 다른 svm 도구는 다른 svm 솔버를 사용할 수 있습니다. 더 나은 svm 솔버를 찾는 것은 또 다른 연구 주제입니다. QP는 svm을 해결하는 기본 방법입니다.
fansia
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.