극도의 무작위 숲은 무작위 숲과 어떻게 다릅니 까?


18

ER이보다 효율적인 구현입니까 (예 Extreme Gradient Boosting: 그래디언트 부스팅). 실제 관점과의 차이점이 중요합니까? 그것들을 구현하는 R 패키지가 있습니다. 효율성뿐만 아니라 다른 영역에서도 "일반"구현 (R의 RandomForest 패키지)을 극복하는 새로운 알고리즘입니까?

극도의 랜덤 포레스트 http://link.springer.com/article/10.1007%2Fs10994-006-6226-1

답변:


20

RF는 트리에서 분할을 최적화하고 (즉, 결정과 관련하여 최상의 정보를 얻을 수있는 것을 선택) ERF는 무작위로 만듭니다. 지금,

  • 최적화 비용 (별로는 아니지만 여전히)이므로 ERF가 더 빠릅니다.
  • 최적화는 앙상블 또는 전체 오버 피팅에서 트리의 상관 관계에 기여할 수 있으므로, 특히 신호가 약한 경우 ERF가 더 강력 할 수 있습니다.

이 방향으로 나아가면 각 나무 수준에서 분할을 동일하게하여 추가 속도를 얻을 수 있습니다.이 방법으로 나무를 양치류 로 변환하면 매우 흥미 롭습니다. 내가 R 구현 이러한의 individuum의는.


링크가 끊어졌습니다. CVLAB : Ferns
smci

RF는 데이터 셋에서 작은 트리로 지식을 압축하는 최적화를 사용하기 때문에 ERF로 생성 된 트리가 RF보다 훨씬 크다고 생각합니다.
Qbik
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.