왜 또는 왜 그렇지 않을지에 대한 추론이 있지만 이것은 간단한 질문이라고 생각합니다. 내가 묻는 이유는 내가 최근에 자체 RF 구현을 작성했으며 그것이 잘 수행하더라도 예상 한 것만 큼 성능이 좋지 않다는 것입니다 ( Kaggle 사진 품질 예측 경쟁 데이터 세트, 우승 점수 및 일부 어떤 기술이 사용되었는지에 관한 후속 정보).
이러한 상황에서 가장 먼저하는 일은 내 모델의 플롯 예측 오류이므로 주어진 각 예측 값에 대해 올바른 목표 값에서 떨어진 평균 바이어스 (또는 편차)를 결정합니다. 내 RF의 경우이 줄거리를 얻었습니다.
이것이 RF에 대해 일반적으로 관찰되는 바이어스 패턴인지 궁금합니다 (그렇지 않으면 데이터 세트 및 / 또는 구현에 특정한 것일 수 있습니다). 물론이 그림을 사용하여 편향을 보정하기 위해 예측을 개선 할 수 있지만 RF 모델 자체에 더 근본적인 오류가 있거나 해결해야하는 단점이 있는지 궁금합니다. 감사합니다.
== 부록 ==
내 초기 조사는이 블로그 항목 인 Random Forest Bias-Update에 있습니다.