SVM이 여전히 우수한 응용 프로그램이 있습니까?


10

SVM 알고리즘은 상당히 오래되었습니다. 1960 년대에 개발되었지만 1990 년대와 2000 년대에 매우 인기가있었습니다. 머신 러닝 과정의 고전적인 부분입니다.

오늘날 미디어 처리 (이미지, 사운드 등)에서 신경망이 완전히 지배적 인 반면 다른 영역에서는 그라디언트 부스팅이 매우 강력한 위치에 있습니다.

또한 최근 데이터 경쟁에서 SVM 기반 솔루션이 관찰되지 않았습니다.

SVM이 여전히 최신 결과를 제공하는 애플리케이션 예제를 찾고 있습니다 (2016 년 기준).

업데이트 : SVM을 설명 할 때 학생 / 동료에게 이론적으로 또는 더 이상 사용되지 않는 접근 방식처럼 보이지 않도록 예를 들어보고 싶습니다.


3
어떤 의미에서 우수합니까? 일부 성능 지표? 심층 신경망을 훈련하려면 상당한 컴퓨터 시간이 필요하지만 랩톱에서 서비스 가능한 SVM을 훈련시킬 수 있습니다.
Sycorax는 Reinstate Monica

@ user777 물론 응용 분야에 적합한 분류 / 회귀 메트릭을 의미합니다. DL의 계산 복잡성 문제는 중요하지만이 질문의 범위를 벗어난 것입니다.
Alleo

답변:


11

논문에 따르면 실제 분류 문제를 해결하기 위해 수백 개의 분류 기가 필요합니까? 랜덤 포레스트 및 그라디언트 부팅 머신과 함께 SVM은 120 개 이상의 데이터 세트 (정확도를 메트릭으로 사용)에 대한 최고 성능의 분류 알고리즘 중 하나입니다.

나는 몇 가지 수정을 통해 실험을 반복 하고이 세 가지 분류 기가 다른 분류기보다 성능이 뛰어나지 만 무료 점심 식사 정리에 따르면 다른 알고리즘 이이 세 가지보다 성능이 좋은 문제가 항상 있다고 말합니다.

따라서 예, 가우시안 커널을 사용하는 SVM은 여전히 ​​미디어와 관련이없는 데이터 세트와 관련된 알고리즘이라고 말할 수 있습니다.


안녕하세요, 답변 감사합니다! 이 흥미로운 연구를 보았습니다. 내가 이해하는 한, 아이디어는 심각한 조정없이 얼마나 많은 분류 기가 제공하는지 확인하는 것이 었습니다 (데이터 분석가는 조정 IMO를 수행 해야 함 ). 지역 관련 연구가 더 흥미로울 것입니다.
Alleo

1
Delgado 등은 모두 최고의 하이퍼 파라미터에 대한 세부 검색을 수행하지 않았지만 검색을 수행 한 경우를 기억합니다. 질문 (나는 대답이 없다)은 최고의 hypoparameters에 대한 더 세밀한 검색이 다른 결과를 가져올 지 여부입니다. 그것이 사실이라면 그것은 SVM에 대한 경쟁 알고리즘이 일반적으로 특정 하이퍼 파라미터의 정확도에서 매우 급격한 피크를 가짐을 의미하며, 이는 알고리즘의 부정적인 요소라고 생각합니다.
Jacques Wainer

또한 하나의 작은 의견은 UCI 데이터 세트 (테스트에 사용)가 대부분 매우 작다는 것입니다. 이것이 부스팅의 나쁜 결과에 대한 설명이 될 수 있는지 궁금합니다. 많은 데이터가있는 대부분의 kaggle 과제는 GB의 우수한 성능을 보여줍니다.
Alleo

데이터 세트가 작다는 데 동의합니다. 더 큰 데이터 세트의 경우 현재 랜덤 포리스트를 사용하고 있습니다. 하이퍼 파라미터에 더 익숙해지면 GBM을 사용하기 시작할 것입니다. GBM이 얼마나 합리적인지 알 수 없습니다.
Jacques Wainer
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.