답변:
교차 검증 실험 결과 데이터에서 Support Vector Machine이 Naive Bayes보다 성능이 우수하거나이 특정 데이터 세트에 대해 분류기의 하이퍼 매개 변수를 c로 설정해야한다는 것을 알 수 있습니다. 이 지식으로 무장 한 후 사용 가능한 모든 데이터를 사용하여 "생산"분류기를 훈련시키고 문제에 적용하십시오.
대부분의 경우 여러 모델의 평균을 계산하는 방법이 명확하지 않습니다. 예를 들어, 3 개의 의사 결정 트리 또는 가장 가까운 이웃 분류기의 평균은 얼마입니까?
교차 검증 결과는 보증이 아니라 추정치이며 생산 분류 기가 유사한 품질 (및 수량)의 데이터로 훈련 된 경우 이러한 추정치가 더 유효하다는 점을 명심해야합니다. 추정을 사용하여 추론을 수행하는 방법을 개발하는 데 상당한 노력이있었습니다. 즉, 통계적으로 건전한 방법으로, 그 방법 A는 일반적으로 이들 데이터에 대한 방법 B보다 우수하다.