두 가지 모델 (h2o AutoML을 사용하는 이진 분류기)을 훈련했으며 사용할 모델을 선택하려고합니다. 다음과 같은 결과가 있습니다.
model_id auc logloss logloss_train logloss_valid gini_train gini_valid
DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975
DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662
auc
과 logloss
열이 교차 유효성 검사 측정 항목 (교차 검증은 훈련 데이터를 사용). ..._train
및 ..._valid
메트릭은 각각 모델을 통해 교육 및 검증 측정을 실행하여 발견된다. 나는 중 하나를 사용하려면 logloss_valid
또는를 gini_valid
상기 최적의 모델을 선택 할 수 있습니다.
모델 1은 더 나은 gini (즉, 더 나은 AUC)를 갖지만 모델 2는 더 나은 logloss를 갖습니다. 내 질문은 어떤 것을 선택해야하는지 생각하고, gini (AUC) 또는 logloss를 의사 결정 지표로 사용하는 것의 장점 / 단점은 무엇입니까?