답변:
일반적으로 항상 더 나은 성능을 발휘한다는 것은 사실이 아닙니다. 각각의 고유 한 장점 / 약점을 가진 몇 가지 앙상블 방법이 있습니다. 어느 것을 사용해야하는지 그리고 문제에 달려 있습니다.
예를 들어, 분산이 높은 모델 (데이터에 너무 적합)이있는 경우 배깅을 사용하면 이점이 있습니다. 바이어스 된 모델이있는 경우 Boosting과 함께 사용하는 것이 좋습니다. 앙상블을 형성하는 다른 전략도 있습니다. 주제가 너무 넓어서 한 번의 답변으로 다루기가 어렵습니다.
그러나 내 요점은 : 설정에 잘못된 앙상블 방법을 사용하면 더 나아 지지 않을 것입니다. 예를 들어 바이어스 된 모델과 함께 Bagging을 사용하면 도움이되지 않습니다.
또한 확률 설정에서 작업해야하는 경우 앙상블 방법도 작동하지 않을 수 있습니다. 됩니다 알려진 (에이다 부스트와 같은 가장 인기있는 형태로) 밀어주는 것은 좋지 확률 추정치를 제공하는 것이다. 즉, 분류뿐만 아니라 데이터에 대해 추론 할 수있는 모델을 원한다면 그래픽 모델을 사용하는 것이 좋습니다.