Python (Random Forest Regressor)의 Scikit Learn을 사용하여 예측 모델을 훈련했으며 수동 예측을위한 Excel 도구를 만들기 위해 각 기능의 가중치를 추출하고 싶습니다.
내가 찾은 유일한 것은 model.feature_importances_도움이되지 않습니다.
그것을 달성 할 수있는 방법이 있습니까?
def performRandomForest(X_train, y_train, X_test, y_test):
'''Perform Random Forest Regression'''
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor()
model.fit( X_train , y_train )
#make predictions
expected = y_test
predicted = model.predict( X_test )
#summarize the fit of the model
mse = np.mean(( predicted - expected )** 2)
accuracy = ( model.score ( X_train , y_train ))
return model, mse, accuracy
현재는을 사용하여 사용 model.predict([features])하지만 Excel 파일에 필요합니다.
각 잎의 평균을 복용하면 작동하지 않습니까? 나는 또한 선형 회귀 모델을 시도했고 그 차이는 한계 안에 있습니다. 따라서 임의 포리스트를 내보내는 합리적이고 효율적인 방법이 없다면 선형 회귀로 돌아 가야 할 수도 있습니다.
—
Tasos
고맙지 만 LR에서 이런 식으로 알고있었습니다. 답변으로 표시하여 답변으로 표시 할 수 있습니까?
—
Tasos
다른 사람이 유용한 통찰력을 가지고 있는지 확인하기 위해 며칠 동안 떠날 가치가 있습니다. 데이터 과학 스택 교환은 스택 오버플로보다 훨씬 작으므로 통찰력있는 답변을 얻는 데 2-3 일이 걸립니다.
—
AN6U5
decision trees이므로 선형 회귀를 사용하는 것처럼 하나의 방정식을 얻지 못합니다. 대신if, then, else마지막 잎을 숫자 값으로 바꾸는 많은 논리와 많은 최종 방정식을 얻게 됩니다. 트리를 시각화하고 모든 논리를 제거 할 수 있더라도이 모든 것이 큰 혼란처럼 보입니다. Excel에서 작업하는 경우 Azure를 사용하여 Excel에서 모델을 훈련시키는 것에 대해 생각해보십시오. 그러나 아마도 Excel 내에서 파이썬을 호출 할 것입니다.