1600 개가 넘는 범주 값이 큰 데이터 프레임이 있습니다 .1600 개가 넘는 열이 없도록 대안을 찾을 수있는 방법이 있습니까?
나는 재미있는 링크 http://amunategui.github.io/feature-hashing/#sourcecode 아래에서 이것을 발견했다.
그러나 그들은 내가 원하지 않는 클래스 / 객체로 변환하고 있습니다. 다른 머신 러닝 모델로 테스트 할 수 있도록 최종 출력을 데이터 프레임으로 원합니까? 또는 로지스틱 회귀 또는 XGBoost 이외의 다른 기계 학습 모델을 훈련시키기 위해 생성 된 행렬을 사용할 수있는 방법이 있습니까?
어쨌든 내가 구현할 수 있습니까?