답변:
주어진 데이터 세트에 가장 적합한 분류 방법에 대한 단일 답변은 없습니다 . 주어진 데이터 세트에 대한 비교 연구를 위해서는 항상 다른 종류의 분류기를 고려해야합니다. 데이터 세트의 속성이 주어지면 일부 방법을 선호 할 수있는 힌트가있을 수 있습니다. 그러나 가능하면 모두 실험 해 보는 것이 좋습니다.
NIVEC (Nive Bayes Classifier)와 SVM (Support Vector Machine)에는 각각에 대한 커널 기능 선택을 포함하여 다른 옵션이 있습니다. 둘 다 매개 변수 최적화에 민감합니다 (즉, 다른 매개 변수 선택은 출력을 크게 변경할 수 있음) . 따라서 NBC가 SVM보다 성능이 우수하다는 결과가 나옵니다. 선택한 매개 변수에만 해당됩니다. 그러나 다른 매개 변수를 선택하면 SVM의 성능이 향상 될 수 있습니다.
일반적으로 NBC의 독립성 가정이 데이터 세트의 변수에 의해 충족되고 클래스 중첩 정도가 작은 경우 (즉, 잠재적 선형 결정 경계) NBC가 양호하게 달성 될 것으로 예상됩니다. 예를 들어, 래퍼 기능 선택을 사용하여 최적화 한 일부 데이터 세트의 경우 NBC는 다른 분류자를 물리 칠 수 있습니다. 비슷한 성능을 달성하더라도 고속으로 인해 NBC가 더 바람직합니다.
요약하자면, 한 분류에서 다른 분류보다 성능이 좋지 않은 분류 방법이 다른 분류 방법에서 심각하게 실패 할 수 있으므로 분류 방법을 선호해서는 안됩니다. ( 이것은 데이터 마이닝 문제에서 일반적입니다 ).