배경:
에 xgboost 반복 시도 트리에 맞게 F t을 온통 n 개의 목적은 다음 최소화 예 :
여기서 일차 및 이전 최상의 추정을 통해 2 차 유도체 (Y) (반복에서 t - 1 ) :
그리고 우리의 손실 함수입니다.
질문은 (마침내) :
빌드 하고 특정 스플릿에서 특정 기능 k 를 고려할 때 다음 휴리스틱을 사용하여 일부 스플릿 후보 만 평가합니다. 모든 예제를 x k로 정렬하고 정렬 된 목록을 통과 한 다음 두 번째 미분 h i를 합 칩니다 . 합계가 ϵ 이상 변경 될 때만 분할 후보를 고려합니다 . 왜 그런 겁니까???
그들이주는 설명은 나를 회피합니다.
그들은 우리가 이전 방정식을 다음과 같이 다시 작성할 수 있다고 주장합니다.
그리고 나는 대수를 따르지 않습니다-왜 그것이 같은지 보여줄 수 있습니까?
그리고 그들은 "이것은 레이블 와 weight h i " 로 정확하게 가중 된 제곱 손실입니다 . ..
포럼이 너무 길면 감사합니다.