나는 데이터 마이닝 / 기계 학습 등을 처음 사용합니다. 예측을 개선하기 위해 여러 모델과 동일한 모델의 런을 결합하는 몇 가지 방법에 대해 읽었습니다.
몇 가지 논문 (이론과 그리스 문자는 흥미롭고 훌륭하지만 코드와 실제 예제는 짧음)을 읽은 것에 대한 나의 인상은 다음과 같이 가야한다는 것입니다.
모델 ( knn
, RF
등)을 가져 와서 0과 1 사이의 분류 자 목록을 얻습니다. 내 질문은 이러한 분류 자 목록 각각을 결합하는 방법입니다. 최종 모델에 들어가는 열의 수가 같거나 다른 트릭이 있도록 훈련 세트에서 동일한 모델을 실행합니까?
제안 / 예에 R 코드가 포함되어 있으면 좋을 것입니다.
참고 : 훈련 세트에 100k 라인, 테스트 세트에 70k 및 10 개의 열이있는 데이터 세트를위한 것입니다.