아래 코드를 사용하여 사기 탐지를위한 분류 자 (결정 트리, 임의 포리스트, 로지스틱 회귀 등과 같은 표준 분류 자 중 하나 일 수 있음) 가 있다고 가정합니다 .
library(randomForest)
rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier
Say, Y is a binary outcome - Fraud/Not-Fraud
이제 보이지 않는 데이터 세트를 예측했습니다 .
pred = predict(rfFit, newData)
그럼 난 내 분류에 조사 팀의 피드백을 얻은 나는 분류하는 실수를 만든 것으로 나타났습니다 비 사기 (즉, 같은 사기 하나 위음성을 ) . 어쨌든 내 알고리즘이 실수했다는 것을 이해할 수있게 할 수 있습니까? 즉, 알고리즘에 피드백 루프를 추가하여 실수를 바로 잡을 수있는 방법은 무엇입니까?
내가 머리 위에서 생각할 수있는 한 가지 옵션 adaboost classifier
은 새로운 분류 기가 이전의 실수를 바로 잡을 수 있도록하는 것이다. 또는 나는 무언가 들었 Incremental Learning
또는 Online learning
. 에 기존 구현 (패키지)이 R
있습니까?
올바른 접근입니까? 또는 처음부터 모델을 작성하는 대신 모델을 조정할 수있는 다른 방법이 있습니까?