SVM 분류를 배우고 있는데 문제가 있습니다. 이 딜레마에 대한 용어가 있는지 확실하지 않습니다.
건강한 사람 (성별)과 간암 환자 (성별)를 고려하여 환자를 SVM으로 분류한다고 가정합니다. 건강한 사람 샘플을 클래스 1로, 암 환자를 클래스 2로 레이블링하면 이진 SVM을 훈련시키고 분류기 1을 얻어 새로운 환자를 예측할 수 있습니다. 이제 다른 시나리오를 상상해보십시오. 먼저 SVM 분류 전에 모든 샘플을 성별로 나눕니다. 각 성별에 대해, 건강한 환자 대 암 환자를 2 개의 클래스로 분류하고 이진 SVM을 훈련시켜 각각 여성 및 남성 샘플에 대한 분류기 2 및 분류기 3을 얻습니다. 문제는 더 정확한 예측을 위해 어떤 분류기 (1 또는 2)를 사용해야하는 새로운 여성 환자가 있는지 여부입니다. 여기 내가 가진 논쟁의 딜레마가 있습니다.
(1) 샘플 수가 많으면 예측이 더 정확해야합니다. 이 주장에 근거하여 분류 자 1이 좋은 선택 인 것 같습니다.
(2) 그러나 우리가 먼저 샘플을 여성 및 남성 그룹으로 나누면 분류기 2는 새로운 환자 (알 수없는 테스트 샘플)가 여성이기 때문에 더 나은 선택으로 보입니다.
이런 종류의 딜레마에 용어가 있습니까, 아니면 더 이상의 정보 나 이와 같은 문제를 해결하는 방법을 아는 사람이 있습니까? 나는 이것이 합법적 인 질문인지 확실하지 않고 순진한 질문에 미리 미안합니다. 감사