XGBoost는 예측 단계에서 누락 된 데이터를 처리 할 수 ​​있습니다


12

최근에 XGBoost 알고리즘을 검토 한 결과이 알고리즘이 교육 단계에서 누락 된 데이터 (대치없이)를 처리 할 수 ​​있음을 알았습니다. XGboost가 새로운 관측치를 예측하는 데 사용되거나 누락 된 데이터를 대치해야 할 때 누락 된 데이터 (대치없이)를 처리 할 수 ​​있는지 궁금합니다.

미리 감사드립니다.

답변:


14

xgboost는 교육 시간에 결 측값이 오른쪽 또는 왼쪽 노드로 들어갈 지 여부를 결정합니다. 손실을 최소화 할 것을 선택합니다. 훈련시 결 측값이없는 경우 기본적으로 새로운 결 측값을 올바른 노드로 전송합니다.

결측 분포에 신호가있는 경우 모델에 따라 적합합니다.

점수 데이터에 결 측값이 훈련 데이터와 다르게 분포되어 있는지주의하십시오. xgboost의 누락 된 처리는 편리하지만 마스킹을 방지하지는 않습니다.

출처 : 이 답변

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.