다음 코드를 사용하여 모델을 훈련시키는 경우 :
import xgboost as xg
params = {'max_depth':3,
'min_child_weight':10,
'learning_rate':0.3,
'subsample':0.5,
'colsample_bytree':0.6,
'obj':'reg:linear',
'n_estimators':1000,
'eta':0.3}
features = df[feature_columns]
target = df[target_columns]
dmatrix = xg.DMatrix(features.values,
target.values,
feature_names=features.columns.values)
clf = xg.train(params, dmatrix)
약 1 분 후에 완료됩니다.
Sci-Kit 학습 방법을 사용하여 모델을 훈련시키는 경우 :
import xgboost as xg
max_depth = 3
min_child_weight = 10
subsample = 0.5
colsample_bytree = 0.6
objective = 'reg:linear'
num_estimators = 1000
learning_rate = 0.3
features = df[feature_columns]
target = df[target_columns]
clf = xg.XGBRegressor(max_depth=max_depth,
min_child_weight=min_child_weight,
subsample=subsample,
colsample_bytree=colsample_bytree,
objective=objective,
n_estimators=num_estimators,
learning_rate=learning_rate)
clf.fit(features, target)
30 분 이상 걸립니다.
기본 코드가 거의 동일하다고 생각합니다 (예 : XGBRegressor
호출 xg.train
)-여기서 무슨 일이 일어나고 있습니까?