저는 20 : 1의 경험 법칙 (총 7 개의 후보 예측 변수에 대해 상당히 큰 표본 (N = 374))을 고려하여 적절한 표본을 가지고 있다고 생각합니다.
내 문제는 다음과 같습니다. 내가 사용하는 예측 변수 집합에 관계없이 분류는 100 %의 특이도 및 0 %의 감도보다 나아지지 않습니다. 그러나 불만족 스럽지만 후보 예측 변수 세트 (내가 벗어날 수없는)를 고려할 때 실제로 이것이 최상의 결과 일 수 있습니다.
그러나 나는 도울 수 없었지만 더 잘할 수 있다고 생각했기 때문에 종속 변수의 범주가 거의 4 : 1로 불균일하게 균형 잡힌 것을 알았습니다. 보다 균형 잡힌 서브 샘플이 분류를 개선 할 수 있습니까?