문제는 의사 결정 트리 구축과 관련이 있습니다. Wikipedia에 따르면 ' Gini coefficient '는 ' Gini impurity ' 와 혼동해서는 안됩니다 . 그러나 의사 결정 트리를 구축 할 때 두 측정 값을 모두 사용할 수 있습니다. 이는 측정 항목을 분할 할 때 선택 항목을 지원할 수 있습니다.
1) '지니 불순물'-표준 의사 결정 트리 분할 메트릭입니다 (위 링크 참조).
2) '지수 계수'-각 분할은 AUC 기준에 따라 평가할 수 있습니다. 각 분할 시나리오마다 ROC 곡선을 구축하고 AUC 메트릭을 계산할 수 있습니다. Wikipedia AUC = (GiniCoeff + 1) / 2;
질문은이 두 가지 방법이 모두 같은가? 한편으로, 나는 지니 계수가 지니 불순물과 혼동되어서는 안된다는 통보를 받았습니다. 반면에,이 두 가지 방법 모두 의사 결정 트리 분할의 품질을 평가하는 동일한 작업을 수행하는 데 사용할 수 있습니다.