부스팅 트리 모델에는 3 개의 튜닝 매개 변수가 있다는 것을 알고 있습니다.
- 트리 수 (반복 횟수)
- 수축 매개 변수
- 분할 수 (각 구성 요소의 크기)
내 질문은 : 각 튜닝 매개 변수에 대해 최적의 값을 어떻게 찾아야합니까? 그리고 어떤 방법?
수축 매개 변수와 트리 수 매개 변수는 함께 작동합니다. 즉, 수축 매개 변수의 값이 작을수록 트리 수의 값이 높아집니다. 그리고 우리도 이것을 고려해야합니다.
분할 수에 대한 최적의 값을 찾는 방법에 특히 관심이 있습니다. 모델 뒤의 교차 검증 또는 도메인 지식을 기반으로해야합니까?
그리고 이러한 것들이 gbm
R 의 패키지에서 어떻게 수행 됩니까?