XGBoost는 범주 형 변수와 연속 형 종속 변수를 모두 다루는 데 큰 도움이되었습니다. 그러나 XGBoost 문제에 대해 최적화 된 매개 변수를 어떻게 선택합니까?
이것이 최근 Kaggle 문제에 대한 매개 변수를 적용한 방법입니다.
param <- list( objective = "reg:linear",
booster = "gbtree",
eta = 0.02, # 0.06, #0.01,
max_depth = 10, #changed from default of 8
subsample = 0.5, # 0.7
colsample_bytree = 0.7, # 0.7
num_parallel_tree = 5
# alpha = 0.0001,
# lambda = 1
)
clf <- xgb.train( params = param,
data = dtrain,
nrounds = 3000, #300, #280, #125, #250, # changed from 300
verbose = 0,
early.stop.round = 100,
watchlist = watchlist,
maximize = FALSE,
feval=RMPSE
)
실험하기 위해 결과를 개선하기 위해 다른 매개 변수 집합을 임의로 선택 (직관적으로)합니다.
어쨌든 최적화 된 (최상의) 매개 변수 선택을 자동화합니까?
(답은 어떤 언어로든 가능합니다. 나는 단지 기술을 찾고 있습니다)