cognitiveclass.ai에서 R 과정에 대한 기계 학습을 마쳤으며 randomforests를 실험하기 시작했습니다.
R의 "randomForest"라이브러리를 사용하여 모델을 만들었습니다.이 모델은 좋거나 나쁜 두 클래스로 분류됩니다.
모델이 과적 합되면 자체 훈련 세트의 데이터에서는 잘 수행되지만 샘플에서 벗어난 데이터에서는 제대로 수행되지 않습니다.
내 모델을 훈련하고 테스트하기 위해 전체 데이터 세트를 섞어서 훈련 용 70 %와 테스트 용 30 %로 나누었습니다.
내 질문 : 테스트 세트에서 수행 한 예측에서 100 % 정확도를 얻었습니다. 이게 나쁜가요? 사실이 너무 좋은 것 같습니다.
목표는 파형에 따라 서로 4 개의 파형을 인식하는 것입니다. 데이터 세트의 기능은 대상 파형을 사용한 파형의 동적 시간 왜곡 분석 비용 결과입니다.
사이트에 오신 것을 환영합니다! 노이즈 데이터를 예측하려고 했습니까?
—
Toros91
재편성, 훈련 및 테스트 할 때마다 정확도는 100 %입니까?
—
Alex
아니 정확히 @ 알렉스 그러나 그것은 매우 높은 같은 98,55 % 유지
—
밀라노 반 DIJCK
@ 알렉스 11.35 % "확인"88.65 % "나쁜"
—
밀라노 반 DIJCK
상당히 불균형입니다. 리샘플링 (반복 샘플링)을 사용하여 트레이닝 세트의 균형을 OK 클래스 (예 : 30 %)로 기울이고 테스트 / 검증 세트에서 11/89 비율을 유지하십시오. 무엇을 얻습니까?
—
Alex