xgboost에서 min_child_weight 매개 변수 의 정의 는 다음과 같습니다.
어린이에게 필요한 인스턴스 가중치 (헤 시안)의 최소 합계. 트리 분할 단계에서 인스턴스 가중치의 합계가 min_child_weight보다 작은 리프 노드가 생성되면 빌드 프로세스는 추가 분할을 포기합니다. 선형 회귀 모드에서 이는 단순히 각 노드에 있어야하는 최소 인스턴스 수에 해당합니다. 알고리즘이 클수록 더 보수적입니다.
나는 xgboost에서 원본 논문 (공식 8과 방정식 9 직후의 것을 참조하십시오), 이 질문 및 Google 검색의 처음 몇 페이지에 나타나는 xgboost와 관련된 대부분을 읽었습니다. ;)
기본적으로 나는 왜 우리가 왜 헤센의 합에 구속을 가하고 있는지에 대해 만족하지 않습니까? 원래 논문에서 분만에 나의 유일한 생각 은 각 인스턴스의 '무게'로 를 갖는 가중 양자 스케치 섹션 (및 방정식 3 가중 제곱 손실의 재구성)과 관련이 것입니다.
추가 질문은 왜 선형 회귀 모드의 인스턴스 수에 불과합니까? 나는 이것이 제곱 방정식의 이차 미분과 관련이 있다고 생각합니까?