‖w‖2최대(0,1-YI(w⊺XI+B))
그러나 하드 마진 SVM의 경우 전체 목적 함수는
만약이 경우에 가 손실 함수라면, 2 차 손실 함수라고 부를 수 있습니까? 그렇다면 왜 하드 마진 SVM의 손실 함수가 소프트 마진 SVM에서 정규화되고 2 차 손실에서 힌지 손실로 변경됩니까?
‖w‖2최대(0,1-YI(w⊺XI+B))
그러나 하드 마진 SVM의 경우 전체 목적 함수는
만약이 경우에 가 손실 함수라면, 2 차 손실 함수라고 부를 수 있습니까? 그렇다면 왜 하드 마진 SVM의 손실 함수가 소프트 마진 SVM에서 정규화되고 2 차 손실에서 힌지 손실로 변경됩니까?
답변:
소프트 마진 SVM 의 힌지 손실 항 는 오 분류에 불이익을 줍니다. 하드 마진 SVM에는 정의에 따라 오 분류가 없습니다.
이것은 실제로 하드 마진 SVM이 \ | \ mathbf {w} \ | ^ 2 를 최소화하려고 함을 의미합니다 . SVM 문제의 공식화로 인해 마진은 . 따라서 \ mathbf {w} 의 표준을 최소화 하는 것은 마진을 최대화하는 것과 기하학적으로 동일합니다. 정확히 우리가 원하는 것!
정규화 는 솔루션 벡터에서 큰 계수에 불이익을 주어 과적 합을 피하는 기술입니다. 하드 마진 SVM에서 손실 기능 둘 다 와 regularizer은.
소프트 마진 SVM에서 힌지 손실 항 은 정규화 기처럼 작동하지만 대신 대신 에서 여유 변수에 합니다. 정규화는 희소성을 유발 지원 벡터 측면에서 표준 SVM이 희박합니다 (최소 제곱 SVM과 달리).
명확히하기 위해,
는 점이 선형으로 분리 가능해야한다는 제약 조건에 따라 최소화됩니다 (즉, 하나를 완벽하게 분리하는 초평면을 그릴 수 있음). 다시 말해, 솔루션으로 고려할 수있는 w의 유일한 허용 된 값은 두 지점 세트를 분리하는 값입니다.
이제는 하드 마진 SVM이 소프트 마진보다 더 쉽게 "과적 합"한다고 생각됩니다. 충분히 높은 RBF SVM을 사용하면 상상하기가 더 쉬워지고 (과도하게) 복잡하고 (잠재적으로) 과적 합 결정 경계를 만들 수 있습니다. 마진이 높을수록 ( "C"가 높을수록 부정확하게 모방 됨), 두 세트의 점을 완벽하게 분류하는 결정 경계를 찾기가 더 어려워집니다.
"소프트 마진"으로 이동하면 제약 조건이 완화되고 "느슨한"도입을 통해 구속으로 대체됩니다. 이 여유 변수는 "힌지 손실"이라는 용어로 정의됩니다. 단순화 후, 모두가 SVM과 연관시키는 손실 기간과 같은 경첩 + l2에 도달합니다. FWIW, 전적으로 "그라디언트 따르기"문제 대신 SVM을 더 많은 최적화 문제로 프레임 화하고 싶습니다.