배깅은 N 개의 서로 다른 부트 스트랩 샘플에서 N 개의 학습자를 생성 한 다음 예측의 평균을 얻는 프로세스입니다.
내 질문은 : 다른 유형의 샘플링을 사용하지 않는 이유는 무엇입니까? 부트 스트랩 샘플을 사용하는 이유는 무엇입니까?
배깅은 N 개의 서로 다른 부트 스트랩 샘플에서 N 개의 학습자를 생성 한 다음 예측의 평균을 얻는 프로세스입니다.
내 질문은 : 다른 유형의 샘플링을 사용하지 않는 이유는 무엇입니까? 부트 스트랩 샘플을 사용하는 이유는 무엇입니까?
답변:
흥미로운 질문입니다. 부트 스트랩은 잭나이프와 같은 일부 대안에 비해 우수한 샘플링 특성을 가지고 있습니다. 부트 스트랩의 주요 단점은 모든 반복이 원래 데이터 세트보다 큰 샘플 (컴퓨팅 비용이 많이들 수 있음)과 함께 작동해야하며 다른 샘플링 기술은 훨씬 작은 샘플로 작동 할 수 있다는 것입니다.
이 백서 에서는 샘플 크기를 순전히 절단하면 부트 스트랩 기반 배깅에 비해 성능이 저하 될 수 있으므로 그렇게하지 않는 것이 좋습니다. 이 백서에서는 또한 이러한 문제를 피하면서 더 작은 샘플을 포장 평가에 사용하는 새로운 방법을 소개합니다.