나는이 질문에 출판 된 증거, 개인적인 경험, 그리고 추측의 조합으로 대답하려고 노력할 것입니다.
A) 공개 된 증거.
이 질문에 대한 답을 얻는 데 도움이되는 유일한 논문은 Delgado et al 2014-실제 분류 문제를 해결하기 위해 수백 개의 분류 기가 필요합니까? -JMLR 은 UCI에서 121 개의 데이터 세트에 대해 수백 가지의 알고리즘과 구현을 실행합니다. RBF SVM이 "최상의"알고리즘은 아니지만 (올바로 기억하면 임의의 포리스트 임) 상위 3 (또는 5)에 속합니다.
데이터 세트 선택이 실제 문제의 "좋은 샘플"이라고 생각하면 SVM이 새로운 문제에 대해 시도해야하는 알고리즘보다 우선하지만 임의 포리스트를 먼저 시도해야합니다!
그 결과를 일반화하는 한계는 데이터 세트가 거의 모든 키가 크고 마른 체형 (n >> p)이며 매우 드물지 않다는 것입니다. 이는 RF에 더 큰 문제가 아니라 크게 (n과 p 모두) 문제는 아니라고 추측합니다.
마지막으로 여전히 공개 된 증거에 따르면 무작위 포리스트의 서로 다른 구현을 비교하는 두 사이트를 권장합니다.
B) 개인적인 경험.
Delgado와 같은 논문은 모두 머신 러닝 커뮤니티에 매우 중요하다고 생각하므로 결과를 다른 조건에서 재현하려고했습니다. Delgado의 데이터 세트에서 100 + 이진 데이터 세트에 대해 15 가지 알고리즘을 실행했습니다. 또한 하이퍼 파라미터 선택에 더주의를 기울 였다고 생각합니다.
내 결과는 SVM이 "최상의 알고리즘"(평균 4.9) 이었다는 것입니다. 원래 데이터 세트에 많은 멀티 클래스 문제가 포함되어 있기 때문에 SVM이 RF를 통과했습니다.
편집 (6 월 16 일) :
그러나 RF는 방법 방법을 빨리, 그리고 GBM (5.8) 다음에 제 2 최선의 알고리즘 (평균 순위 5.6), nnets (7.2) 등)에 있었다. 나는이 문제에서 표준 로지스틱 회귀 분석을 시도하지 않았지만 탄력적 그물 (L1 및 L2 정규화 LR)을 시도했지만 잘 수행하지 못했습니다 (평균 8.3) ~
결과 분석이나 논문 작성을 아직 완료하지 않았으므로 결과가 포함 된 기술 보고서를 가리킬 수도 없습니다. 몇 주 안에이 답변을 다시 편집하고 결과가 포함 된 기술 보고서를 가리킬 수 있기를 바랍니다.
이 논문은 http://arxiv.org/abs/1606.00930 에서 볼 수 있습니다 . 전체 분석 후 RF 및 SVM은 예상되는 오류율 측면에서 거의 동일하며 SVM이 가장 빠릅니다 (내 놀랍게도 !!). 나는 더 이상 RF를 권장하는 속도가 빠르지 않다.
제 개인적 경험은 SVM이 약간의 정확도를 얻을 수 있지만 RF를 사용하는 것이 거의 항상 더 나은 선택이라는 것입니다.
또한 더 큰 문제의 경우 배치 SVM 솔버를 사용하는 것이 불가능할 수 있습니다 ( LASVM 또는 기타 와 같은 온라인 SVM 솔버를 사용한 적이 없습니다 ).
마지막으로 한 상황에서는 로지스틱 회귀 만 사용했습니다. 이미지 분류 문제에 대해 "강렬한"기능 엔지니어링을 수행했습니다 (예 : 이미지에 대한 두 가지 다른 설명과 설명의 차원 결합 또는 결합 안 함). 그리고 로지스틱 회귀 분석을 사용하여 많은 대안 중에서 선택했습니다 (LR에는 하이퍼 파라미터 검색이 없기 때문에). LR에 따라 최상의 기능을 결정하면 RF를 사용하여 (최고 하이퍼 파라미터 선택) 최종 분류기를 얻습니다.
C) 투기
나는 멀티 클래스 문제에 대해 심각하게 일한 적이 없지만 SVM이 그다지 좋지 않다는 느낌이 듭니다. 문제는 일대일 또는 일대일 솔루션 사이의 문제가 아니라 내가 아는 모든 구현에서 모든 (OVO 또는 OVA) 분류기에 동일한 하이퍼 매개 변수를 사용한다는 것입니다. SVM에 대한 올바른 하이퍼 파라미터를 선택하면 비용이 많이 들기 때문에 내가 아는 상용 구현에서는 각 분류자를 검색하지 않습니다. 나는 이것이 SVM에 대한 문제라고 생각하지만 (RF에 대해서는 문제가 아닙니다!)
그런 다음 다시 멀티 클래스 문제의 경우 RF로 바로 이동합니다.