LightGBM 및 XGBoost


25

어느 것이 더 나은지 이해하려고합니다 (특히 분류 문제에서 더 정확합니다)

LightGBM과 XGBoost를 비교하는 기사를 검색했지만 두 가지만 발견했습니다.

  1. https://medium.com/implodinggradients/benchmarking-lightgbm-how-fast-is-lightgbm-vs-xgboost-15d224568031- 속도에 관한 것이지만 정확성은 아닙니다.
  2. https://github.com/Microsoft/LightGBM/wiki/Experiments-LightGBM 의 저자가 제공 한 것으로 LightGBM이이기는 것은 놀라운 일이 아닙니다.

내 테스트에서 두 알고리즘에 대해 거의 동일한 AUC를 얻지 만 LightGBM은 2-5 배 빠르게 실행됩니다.

LGBM이 너무 멋지다면 여기와 Kaggle에서 그것에 대해 너무 많이 듣지 않는 이유는 무엇입니까?


고맙지 만 LightGBM에는 대부분의 카 글러가 사용하는 R 및 Python 용 패키지도 있습니다. 파이썬과 함께 사용하고 있습니다. 내 데이터 및 인터넷 연구에서 LGBM은 너무 빠르며 정확하지는 않습니다. 그러나 아직 널리 사용되지 않으면 여기에 뭔가 빠진 것일 수도 있습니다 :)
Sergey Nizhevyasov

답변:


21

LightGBM은 XGBoost와 비슷한 훌륭한 구현이지만 몇 가지 특정 방식, 특히 트리를 만드는 방법에 따라 다릅니다.

몇 가지 다른 매개 변수를 제공하지만 대부분 XGBoost와 매우 유사합니다.

동일한 매개 변수를 사용하면 거의 항상 매우 가까운 점수를 얻습니다. 대부분의 경우 훈련은 2-10 배 더 빠릅니다.


왜 더 많은 사람들이 그것을 사용하지 않습니까?

XGBoost는 오래 전부터 사용되었으며 많은 컴퓨터에 이미 설치되어 있습니다. LightGBM은 다소 새롭고 처음에는 Python 래퍼가 없었습니다. 현재 버전은 설치 및 사용이 쉬우므로 여기에 장애물이 없습니다.

Kaggle 및 유사 사이트의 고급 사용자는 이미 LightGBM을 사용하고 있으며 새로운 경쟁마다 점점 더 많은 서비스를 제공합니다. 그래도 스타터 스크립트는 사람들이 이전 코드를 재사용하고 몇 가지 매개 변수를 조정하기 때문에 종종 XGBoost를 기반으로합니다. 사용 방법에 대한 튜토리얼과 가이드가 몇 개 더 있으면 이것이 증가 할 것이라고 확신합니다.


고마워요. 최고의 캐 글러에게는 계산 능력이 큰 문제가 아니며 스크립트를 유지하는 것이 더 쉽습니다.
Sergey Nizhevyasov 2016 년

10

XGBoost는 이제 LightGBM에서 사용하는 것과 유사한 트리 성장을위한 히스토그램 비닝 옵션을 제공합니다. 알고리즘이 정확히 동일하지는 않지만 대략 동일한 수준의 속도 향상 및 유사한 정확도 특성을 제공합니다.

여기에 서로의 올바른 모습을 보여주는 도표와 표가 있습니다. https://github.com/dmlc/xgboost/issues/1950

공평하게도, LightGBM은 자체 성능 테스트를 통해 더 이상 XGBoost (히 스트)를 제거하고 있음을 보여줍니다. https://github.com/Microsoft/LightGBM/blob/master/docs/Experiments.rst#comparison-experiment

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.