교과서 답변이 없습니다. 그러나 여기 몇 가지 생각이 있습니다.
부스팅과 직접 비교하여 부스팅을 볼 수 있습니다. 이들은 편향 분산 트레이드 오프 딜레마에 대한 두 가지 접근 방식입니다. 배깅은 학습자가 약한 반면 배깅 앙상블을 평균화하여 편차가 적고 분산이 높은 일부 학습자는 약간의 편차에 대한 분산을 줄입니다. 반면 부스팅은 다른 약한 학습자와 잘 작동합니다. 부스팅 약한 학습자는 높은 편향과 낮은 분산을 갖습니다. 한 학습자를 다른 학습자 위에 구축함으로써 부스팅 앙상블은 약간의 편차를 위해 편향을 줄이려고합니다.
결과적으로, 예를 들어 나무를 사용하여 약한 학습자로 배깅 및 부스팅을 사용하는 것을 고려할 경우 가장 좋은 사용 방법은 부깅이있는 작고 짧은 나무를 사용하고 배깅이있는 매우 상세한 나무입니다. 그렇기 때문에 부스팅 절차가 의사 결정 스텀프를 가장 약한 학습자로 사용하는 이유는 가능한 가장 짧은 트리 (단일 차원에서 단일 if 조건)입니다. 이 결정 그루터기는 매우 안정적이므로 분산이 매우 낮습니다.
부스팅 절차로 나무를 사용해야 할 이유가 없습니다. 그러나 짧은 트리는 단순하고 구현하기 쉽고 이해하기 쉽습니다. 그러나 부스팅 절차에 성공하기 위해서는 약한 학습자가 분산이 적어야하고 자유도가 거의 없어야합니다. 예를 들어, 나는 약한 학습자로서 신경망을 가질 필요가 없다고 본다.
또한 어떤 종류의 부스팅 절차, 그라디언트 부스팅의 경우 Breiman은 약한 학습자가 나무 인 경우 부스팅 작업을 수행하는 방식에 대한 일부 최적화를 발견했습니다. 따라서 그라디언트 부스팅 트리가 있습니다. ESTL 서적에 좋은 인상이 있습니다.