저는 약 60 x 1000의 행렬을 가지고 있습니다. 저는 1000 개의 특징을 가진 60 개의 물체로보고 있습니다; 60 개의 객체는 3 개의 클래스 (a, b, c)로 그룹화됩니다. 각 클래스에 20 개의 개체가 있으며 실제 분류를 알고 있습니다. 이 60 가지 교육 예제 세트에 대해지도 학습을하고 싶습니다. 분류기 정확도 (및 관련 메트릭)와 1000 가지 기능의 기능 선택에 관심이 있습니다.
먼저, 명명법은 어떻습니까?
이제 실제 질문 :
언급 한대로 임의의 숲을 던지거나 다른 많은 분류자를 던질 수 있습니다. 그러나 미묘한 점이 있습니다. 클래스 c와 클래스 a 및 b를 구별하는 것만 중요합니다. 클래스 a와 b를 풀링 할 수는 있지만 모든 비 c 객체가 두 개의 별개의 클러스터를 형성한다는 사전 지식 을 사용하는 좋은 방법이 있습니까? 무작위 포리스트 또는 그 변형을 사용하는 것이 좋습니다. 왜냐하면 내 포리스트와 유사한 데이터에 효과적이라는 것이 밝혀졌습니다. 그러나 나는 다른 접근법을 시도 할 것이라고 확신 할 수 있습니다.