ET (Extra- (Randomized) -Trees) 기사 에는 편향 분산 분석이 포함되어 있습니다. 16 페이지에서 6 가지 테스트 (트리 분류 및 3 가지 회귀)에 대한 RF를 포함한 여러 방법과 비교할 수 있습니다.
두 가지 방법은 거의 동일하며, 많은 수의 노이즈 특징이있을 때 (고차원 데이터 세트에서) ET가 약간 더 나쁩니다.
즉, (아마도 수동) 기능 선택이 거의 최적이면 성능은 거의 동일하지만 ET는 계산 속도가 빠를 수 있습니다.
기사 자체에서 :
알고리즘의 분석과 여러 테스트 문제 변형에 대한 K의 최적 값 결정은 값이 원칙적으로 문제의 특성, 특히 관련 이 없는 속성 의 비율에 의존한다는 것을 보여주었습니다 . [...] 바이어스 / 분산 분석에 따르면 엑스트라 트리는 편차 를 줄이면서 동시에
바이어스를 늘리면 작동합니다 . [...] 무작위 화가 최적 수준 이상으로 증가하면 편차가 약간 감소하는 반면 바이어스는 종종 크게 증가합니다.
언제나처럼은 총알이 없습니다.
Pierre Geurts, Damien Ernst, 루이 웨 헨케 "매우 랜덤 한 나무"