직장에서 반복적으로 언급 된 AdaBoost 분류기에 대해 들었을 때, 작동 방식과 사용시기에 대해 더 나은 느낌을 얻고 싶었습니다. 계속해서 Google에서 찾은 여러 논문과 자습서를 읽었지만 여전히 이해하기 어려운 분류 기준이 있습니다.
내가 본 대부분의 튜토리얼은 AdaBoost에 대해 많은 분류기 중 가장 가중치가 높은 조합을 찾는 것으로 말합니다. 이것은 나에게 의미가 있습니다. 이해가되지 않는 것은 AdaBoost가 약한 학습자를 한 명만 받아들이는 구현 (예 : MALLET)입니다. 이것은 어떤 의미가 있습니까? AdaBoost에 제공된 분류 기가 하나만있는 경우 가중치가 1 인 동일한 분류기를 다시 반환해서는 안됩니까? 첫 번째 분류기에서 새 분류기를 어떻게 생성합니까?
실제로 AdaBoost를 언제 사용하고 싶습니까? 나는 그것이 즉시 사용 가능한 최고의 분류기 중 하나라는 것을 읽었지만 MaxEnt 분류기를 부스트하려고하면 AdaBoost가 70 % 이상의 f 점수를 얻었습니다. 매우 높은 회수율과 매우 낮은 정밀도로 15 %와 같은 점수를 얻습니다. 그래서 지금 혼란스러워합니다. 언제 AdaBoost를 사용하고 싶습니까? 가능한 경우 엄격한 통계적 대답보다는 직관적 인 것을 찾고 있습니다.