질문 :
- 부스트 회귀 트리 (BRT)와 일반화 된 부스트 모델 (GBM)의 차이점은 무엇입니까? 그것들을 서로 바꿔서 사용할 수 있습니까? 하나는 다른 형태입니까?
- Ridgeway에서 Friedman이 이전에 "Gradient Boosting Machine"(GBM)으로 제안한 내용을 설명하기 위해 "GBM (Generalized Boosted Regression Models)"이라는 문구를 사용한 이유는 무엇입니까? 이 두 약어는 동일하지만 동일한 내용을 설명하지만 다른 구에서 파생됩니다.
배경:
BRT와 GBM이라는 용어가 어떻게 다른지 결정하는 데 문제가 있습니다. 내가 이해하는 것에서 일종의 부스팅 (예 : bagging, bootstrapping, cross-validation)을 통해 확률이 통합 된 분류 및 회귀 트리를 설명하는 용어입니다. 또한 GBM이라는 용어에서 Friedman (2001)은 "Greedy function approximation : gradient boosting machine"이라는 논문에서 처음으로 만들어졌습니다. Ridgeway는 2006 년 Friedman이 그의 패키지 "Generalized Boosted Regression Models (GBM)"에 설명 된 절차를 구현했습니다. 내 분야 (생태학)에서 Elith et al. (2008)은 gbm
종 분포 모델링을위한 Ridgeway의 패키지를 최초로 시연했습니다 . 그러나 Elith et al. Friedman and Ridgeway를 설명하기 위해 "BRT (boosted regression tree)"라는 용어 사용
이 용어를 서로 바꿔서 사용할 수 있는지 혼란 스럽습니까? 한 저자가 이전의 저자가 제안한 것과 동일한 이론을 설명하기 위해 (다른 문구에서) 동일한 약어를 사용한다는 것은 다소 혼란 스럽습니다. 또한 세 번째 저자가이 이론을 생태 학적 용어로 설명 할 때 완전히 다른 용어를 사용했다는 것은 혼란 스럽습니다.
내가 취할 수있는 최선의 방법은 BRT가 분포가 이항 인 GBM의 특정 형태라는 것입니다.하지만 확실하지 않습니다.
엘리스 등. 부스트 회귀 트리는 다음과 같이 두 가지 알고리즘의 장점을 결합합니다. 최종 BRT 모델은 개별 용어가 단순한 트리이며 앞으로 단계적으로 적용되는가 법적 회귀 모델로 이해 될 수있다 "(Elith et al. 2008).