나는 예측 가능한 희소 특징을 가지고 있으며, 또한 예측 가능한 조밀 한 특징이 있습니다. 분류기의 전반적인 성능을 향상 시키려면 이러한 기능을 결합해야합니다.
이제는 이들을 함께 결합하려고 할 때 밀도가 높은 기능은 희소 기능보다 더 많이 지배되는 경향이 있으므로 밀도가 높은 기능이있는 모델에 비해 AUC가 1 % 향상됩니다.
누군가 비슷한 문제를 겪었습니까? 고착 된 입력을 고맙게 생각합니다. 나는 이미 많은 분류기, 분류기의 조합, 기능 변환 및 다른 알고리즘으로 처리를 시도했습니다.
도움을 주셔서 감사합니다.
편집 :
나는 의견에 주어진 제안을 이미 시도했다. 내가 관찰 한 것은 거의 45 %의 데이터에서 희소 한 특징이 실제로 잘 수행되고 희소 한 특징만으로 약 0.9의 AUC를 얻지 만 나머지 특징의 경우 밀도가 높은 특징은 약 0.75의 AUC로 잘 수행된다는 것입니다. 이러한 데이터 세트를 분리하려고 시도했지만 AUC 0.6을 얻으므로 단순히 모델을 훈련시키고 사용할 기능을 결정할 수 없습니다.
코드 스 니펫과 관련하여 너무 많은 것을 시도했지만 정확히 무엇을 공유 해야할지 모르겠습니다.