RandomForest 모델을 사용하여 테스트 데이터를 예측할 때 ValueError가 발생했습니다.
내 코드 :
clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2)
clf.fit(X_fit, y_fit)
df_test.fillna(df_test.mean())
X_test = df_test.values
y_pred = clf.predict(X_test)
오류:
ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
테스트 데이터 세트에서 잘못된 값을 어떻게 찾습니까? 또한 이러한 레코드를 삭제하고 싶지 않습니다. 평균 또는 중간 값으로 대체 할 수 있습니까?
감사.