많은 기능 (1000 이상)이있는 최대 150 개의 예제 (훈련 및 테스트에 분할)가 포함 된 데이터 세트가 있습니다. 데이터에서 잘 수행되는 분류기와 기능 선택 방법을 비교해야합니다. 그래서 다른 검색 방법 (Greedy, BestFirst)과 함께 세 가지 분류 방법 (J48, NB, SVM)과 두 가지 기능 선택 방법 (CFS, WrapperSubset)을 사용하고 있습니다.
비교하면서 저는 훈련 정확도 (5 배 교차 접기)와 테스트 정확도를보고 있습니다.
다음은 J48 및 CFS-BestFirst의 결과 중 하나입니다.
{ "accuracyTraining": 95.83, "accuracyTest": 98.21}
많은 결과가 이와 같으며 SVM에는 테스트 정확도가 훈련보다 훨씬 높다는 것을 나타내는 많은 결과가 있습니다 (트레이닝 : 60 %, 테스트 : 98 %)
이런 종류의 결과를 어떻게 의미있게 해석 할 수 있습니까? 그것이 더 낮다면, 그것이 너무 적합하다고 말할 것입니다. 이 경우 모든 결과를 살펴보면 편향과 분산에 대해 언급해야 할 것이 있습니까? 교육 및 테스트 세트를 다시 선택하거나 모든 데이터에 대해 교차 유효성 검사를 사용하는 등이 분류를 의미있게 만들려면 어떻게해야합니까?
73 개의 교육 및 58 개의 테스트 인스턴스가 있습니다. 일부 답변에는 게시시이 정보가 없었습니다.