부트 스트랩은 대체를 통한 랜덤 샘플링에 의존하는 테스트 또는 메트릭으로, 예측 모델 성능의 검증, 앙상블 방법, 바이어스 추정 및 모델 매개 변수의 변동 등과 같은 여러 상황에서 도움이되는 방법입니다. 선택하지 않은 데이터 포인트가 테스트 데이터 세트라고 가정하고 원래 데이터 세트에서 교체하여 샘플링을 수행합니다. 이 절차를 여러 번 반복하고 모델 성능의 추정값으로 평균 점수를 계산할 수 있습니다. 또한 부트 스트랩은 앙상블 교육 방법과 관련이 있습니다. 각 부트 스트랩 데이터 세트를 사용하여 모델을 구축하고 대다수 투표 (분류) 또는 평균 (수치 예측)을 사용하여 이러한 모델을 앙상블에 "가방"할 수 있기 때문입니다. 이 모델은 최종 결과입니다.
교차 검증은 모델의 성능을 검증하는 절차이며 훈련 데이터를 k 개의 부분으로 분할하여 수행됩니다. k-1 부품은 훈련 세트이고 다른 부품은 테스트 세트라고 가정합니다. 매번 데이터의 다른 부분을 다르게 유지하면서 k 번을 반복 할 수 있습니다. 마지막으로 k 점수의 평균을 성능 추정치로 사용합니다. 교차 검증은 편향 또는 분산으로 인해 어려움을 겪을 수 있습니다. 스플릿 수를 늘리면 분산도 증가하고 바이어스는 감소합니다. 반면에 분할 수를 줄이면 편차가 증가하고 분산이 감소합니다.
요약하면, 교차 유효성 검사는 사용 가능한 데이터 세트를 분할하여 여러 데이터 세트를 작성하며, 부트 스트랩 방법은 원래 데이터 세트를 사용하여 교체로 리샘플링 한 후 여러 데이터 세트를 작성합니다. 부트 스트랩은 모델 검증에 사용될 때 교차 검증만큼 강력하지 않습니다. 부트 스트랩은 앙상블 모델을 작성하거나 매개 변수를 추정하는 것에 관한 것입니다.