간단한 분류에는 class-0과 class-1의 두 가지 클래스가 있습니다. 일부 데이터에는 class-1의 값만 있으므로 class-0의 값은 없습니다. 이제 클래스 1의 데이터를 모델링하는 모델을 만드는 것에 대해 생각하고 있습니다. 따라서 새로운 데이터가 올 때이 모델은 새로운 데이터에 적용되며 새로운 데이터가이 모델에 얼마나 적합한 지 알 수있는 가능성을 찾습니다. 그런 다음 임계 값과 비교하여 부적절한 데이터를 필터링 할 수 있습니다.
내 질문은 :
- 이 문제를 해결하는 좋은 방법입니까?
- 이 경우 RandomForest 분류기를 사용할 수 있습니까? 분류 기가 노이즈로 간주하기를 원하는 클래스 0에 인공 데이터를 추가해야합니까?
- 다른 아이디어 가이 문제에 도움이 될 수 있습니까?