12 최근에 XGBoost 알고리즘을 검토 한 결과이 알고리즘이 교육 단계에서 누락 된 데이터 (대치없이)를 처리 할 수 있음을 알았습니다. XGboost가 새로운 관측치를 예측하는 데 사용되거나 누락 된 데이터를 대치해야 할 때 누락 된 데이터 (대치없이)를 처리 할 수 있는지 궁금합니다. 미리 감사드립니다. machine-learning missing-data data-imputation xgboost — 리카르도 UES 소스
14 xgboost는 교육 시간에 결 측값이 오른쪽 또는 왼쪽 노드로 들어갈 지 여부를 결정합니다. 손실을 최소화 할 것을 선택합니다. 훈련시 결 측값이없는 경우 기본적으로 새로운 결 측값을 올바른 노드로 전송합니다. 결측 분포에 신호가있는 경우 모델에 따라 적합합니다. 점수 데이터에 결 측값이 훈련 데이터와 다르게 분포되어 있는지주의하십시오. xgboost의 누락 된 처리는 편리하지만 마스킹을 방지하지는 않습니다. 출처 : 이 답변 — 덱스 그 로브 스 소스