여러 분류기를 훈련 시키거나 여러 가지 특징 추출 방법을 사용할 수있는 상황이 많이 있습니다. 문헌에서 저자는 종종 데이터의 무작위 분할에 대한 평균 분류 오류 (즉, 이중 중첩 교차 검증 후)를 제공하고 때로는 분할에 대한 오류에 차이를 주기도합니다. 그러나 이것 자체로는 하나의 분류 기가 다른 분류기보다 훨씬 우수하다고 말할 수는 없습니다. Chi-squared 테스트, t-test, post-hoc 테스트 등을 사용하는 ANOVA를 사용하여 이에 대한 많은 다른 접근법을 보았습니다.
통계적 유의성을 결정하기 위해 어떤 방법을 사용해야합니까? 그 질문의 기초는 : 분류 점수의 분포에 대해 어떤 가정을해야합니까?