나는 임의의 숲에 상당히 익숙합니다. 과거에는, 나는 항상의 정확성을 비교 한 시험 대에 맞게 에 대한 열차 대에 맞는 어떤 overfitting을 감지 할 수 있습니다. 그러나 나는 여기서 그것을 읽었 습니다 .
"임의의 포리스트에서는 교차 검증 또는 별도의 테스트 세트가 필요하지 않으므로 테스트 세트 오류를 편견없이 추정 할 수 있습니다. 실행 중 내부적으로 추정됩니다 ..."
위의 작은 단락 은 가방 외부 (oob) 오류 추정 섹션 에서 찾을 수 있습니다 . 이 Out of Bag Error 개념은 완전히 새로운 개념이며 약간 혼란스러운 점은 모델의 OOB 오류가 35 % (또는 65 % 정확도) 인 방법이지만 데이터에 교차 검증을 적용하는 경우 (단순한 보류) 방법)과 맞는 대 테스트 대 맞는 대 기차를 비교하십시오 . 각각 65 %의 정확도와 96 %의 정확도를 얻습니다. 내 경험상 이것은 과적 합으로 간주되지만 OOB는 내 적합 대 테스트 오류 와 마찬가지로 35 % 오류를 보유합니다 . 과적 합입니까? 임의 포리스트에서 과적 합을 확인하기 위해 교차 유효성 검사를 사용해야합니까?
요컨대, 내가 맞는 vs 기차 가 내가 너무 적합 하다는 것을 나타낼 때 테스트 세트 오류의 편견없는 오류를 얻기 위해 OOB를 신뢰해야하는지 확실하지 않습니다 !