SVM과 로지스틱 회귀 비교


37

누군가 SVM 또는 LR을 언제 선택할지에 대한 직감을 줄 수 있습니까? 나는 두 목표의 초평면 학습의 최적화 기준 사이의 차이점이 무엇인지에 대한 직관을 이해하고 싶습니다. 각 목표는 다음과 같습니다.

  • SVM : 가장 가까운 지원 벡터 사이의 마진을 최대화하려고
  • LR : 사후 클래스 확률 최대화

SVM과 LR의 선형 피처 공간을 고려해 봅시다.

내가 이미 알고있는 몇 가지 차이점 :

  1. SVM은 결정적이지만 LR은 확률 론적이지만 확률 점수에 Platts 모델을 사용할 수 있습니다.
  2. 커널 공간의 경우 SVM이 더 빠릅니다 (저장소는 벡터 만 지원합니다)

2
이 문장이 잘못되었습니다 : " LR : 사후 클래스 확률 최대화 ". 로지스틱 회귀는 사후 밀도가 아닌 가능성을 최대화합니다. 베이지안 로지스틱 회귀 분석 은 다른 이야기이지만, 이것이 언급하는 경우 구체적이어야합니다.
Digio

답변:


30

선형 SVM과 로지스틱 회귀는 일반적으로 실제로 비슷한 성능을 발휘합니다. 데이터를 선형으로 분리 할 수 ​​없다고 생각하거나 LR이 일반적으로 허용하는 것보다 이상치에 더 견고해야하는 경우 비선형 커널과 함께 SVM을 사용하십시오. 그렇지 않으면 로지스틱 회귀 분석을 먼저 시도하고 더 간단한 모델을 사용하는 방법을 확인하십시오. 로지스틱 회귀 분석이 실패하면 RBF와 같은 비선형 커널로 ​​SVM을 사용해보십시오.

편집하다:

좋아, 목적 함수의 출처에 대해 이야기 해 보자.

로지스틱 회귀는 일반 선형 회귀에서 비롯됩니다. 이 컨텍스트에서 로지스틱 회귀 목표 함수에 대한 자세한 설명은 여기에서 찾을 수 있습니다. https://stats.stackexchange.com/a/29326/8451

Support Vector Machines 알고리즘은 훨씬 더 기하학적으로 동기가 부여 됩니다. 우리는 확률 모델을 가정하는 대신, 지원 벡터와 관련하여 "최적"을 정의하는 특정 최적 분리 초평면을 찾으려고 노력하고 있습니다. 선형 사례가 유사한 결과를 제공 할지라도 여기에서 로지스틱 회귀 분석에 사용하는 통계 모델과 유사한 것은 없습니다. 실제로 이것은 로지스틱 회귀가 "와이드 마진"분류기를 생성하는 데 매우 효과적이라는 것을 의미합니다. 모든 SVM이 수행하려고합니다 (특히, SVM은 클래스 간 마진을 최대화하려고합니다).

나는 나중에 이것으로 돌아와 잡초에 조금 더 깊이 들어 가려고 노력할 것입니다.


1
그러나 여전히 다음과 같은 SVM v / s LR의 목적 함수에서 직관적 인 차이점이 무엇인지에 대한 내 질문에 대답하지 않습니다. (a) SVM : 가장 가까운 지원 벡터 사이의 마진을 최대화하려고합니다 (b) LR : 사후 클래스 확률 최대화
user41799

그건 완전히 다른 질문입니다. 언제 모델을 사용해야하는지 또는 객관적인 기능의 형태에 동기를 부여하는 것이 무엇입니까?
David Marx

1
나는 그들의 목적 함수의 형태에 동기를 부여하는 것에 더 관심이 있습니다
user41799

4
나는 나중에 이것으로 돌아와 잡초에 좀 더 깊이 들어 가려고 노력할 것이다. 나는 단지 4 년 후에 무언가의 중간에있다 .
user1717828

23

로지스틱 회귀 분석 vs SVM

이미지는 SVM과 로지스틱 회귀의 차이점과 사용 방법을 나타냅니다.

이 그림은 Andrew NG의 "기계 학습"코스 과정에서 나옵니다. 7 주차 : "지원 벡터 머신-SVM 사용"의 끝에서 찾을 수 있습니다.


"기능"이란 고유 속성의 수 또는 해당 속성에 속하는 총 고유 값의 수를 의미합니까?
Ahmedov 2016 년

예 : 고무의 가격 가격 예측에서 한 가지 특징은 기상 가격입니다. 하나는 날씨 등입니다 .....
JSONParser

실제로, 이미지는 차이점에 대해 아무 말도하지 않습니다 ...
Jan Kukacka

차이가 틀릴 수 있습니다. 단어 비교가 더 나을 수 있습니다
JSONParser

1
  • LR은 결정에 대한 신뢰로 해석 될 수있는 보정 된 확률을 제공합니다.
  • LR은 우리에게 제한되지 않고 매끄러운 목표를 제공합니다.
  • LR은 베이지안 모델 내에서 (직접적으로) 사용될 수 있습니다.
  • SVM은 충분한 확신을 가지고 올바른 결정을 내린 사례를 처벌하지 않습니다. 이것은 일반화에 좋습니다.
  • SVM은 멋진 이중 형식으로 커널 트릭을 사용할 때 스파 스 솔루션을 제공합니다 (확장 성 향상).

확인 로지스틱 회귀, 토론토 CSC2515 대학 대 서포트 벡터 머신 케빈 Swersky으로합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.