랜덤 포레스트는 실무자들 사이에서 가장 효과적인 분류 기술 중 하나로 명성을 얻고 있습니다. 그러나 우리는 학습 이론 문헌에서 그것들을 많이 만나지 않습니다. 이 이론을 깊이 탐구하고 싶다면 어디에서 시작해야할까요?
랜덤 포레스트는 실무자들 사이에서 가장 효과적인 분류 기술 중 하나로 명성을 얻고 있습니다. 그러나 우리는 학습 이론 문헌에서 그것들을 많이 만나지 않습니다. 이 이론을 깊이 탐구하고 싶다면 어디에서 시작해야할까요?
답변:
Simone의 대답에 따라 Gerard Biau는 임의의 숲에 대한 수렴과 일관성에 대해 몇 가지 훌륭한 논문을 가지고 있습니다. 이 분석은 Breiman 2001에 비해 약간 단순화 된 버전의 알고리즘에 대한 것이지만 이전 결과에 비해 덜 단순화되었습니다.
Biau의 논문 (협력자와 함께)은 다음 웹 사이트에서 모두 볼 수 있습니다.
http://www.lsta.upmc.fr/BIAU/publications.html
특히 관련있는 것은 일관성에 관한 "인쇄"작업입니다 : http://www.lsta.upmc.fr/BIAU/sbv.pdf
임의의 포리스트 내용이 포함 된 2-3 개의 다른 논문이 있습니다. 방금 cstheory에 가입 했으므로 두 개 이상의 링크를 게시 할 수 없지만 위의 간행물 사이트에는 모두 링크가 있습니다.
이것이 도움이 되길 바랍니다. 이 방법을 주로 실험적으로 사용한 후 2008 년 이후 최근 활동이 급증한 것으로 보입니다. 그리고 좋은 소식은, 이론적 연구가이 방법이 강력하고 좋은 성질을 가지고 있음을 보여주는 것으로 보입니다.
RF에 관한 Breiman의 2001 년 논문을 이미 보신 것 같습니다. 다른 참고 문헌을 지적 할 수 있습니다.
이론을 증명할 수있는 다른 RF 단순화에 대한 실증적 비교 : 갭 좁히기 : 이론과 실제의 숲
이것은 내가 제공 할 수있는 최신 참조입니다. 이 논문에서는 RF의 이론적 결과에 대한 초기 작업에 관한 Biau 논문의 인용을 찾을 수 있습니다.
RF의 변수 중요도에 대한 이론적 결과에 관심이있는 경우 : 무작위 트리의 포리스트에서 변수 중요도 이해
실제로 나는 마지막 논문의 저자 (Gilles Louppe)가 arxiv에 그의 박사 학위 논문 (v2)을 게시했습니다 : 임의의 숲 이해 : 이론에서 실습까지