Python (Random Forest Regressor)의 Scikit Learn을 사용하여 예측 모델을 훈련했으며 수동 예측을위한 Excel 도구를 만들기 위해 각 기능의 가중치를 추출하고 싶습니다.
내가 찾은 유일한 것은 model.feature_importances_
도움이되지 않습니다.
그것을 달성 할 수있는 방법이 있습니까?
def performRandomForest(X_train, y_train, X_test, y_test):
'''Perform Random Forest Regression'''
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor()
model.fit( X_train , y_train )
#make predictions
expected = y_test
predicted = model.predict( X_test )
#summarize the fit of the model
mse = np.mean(( predicted - expected )** 2)
accuracy = ( model.score ( X_train , y_train ))
return model, mse, accuracy
현재는을 사용하여 사용 model.predict([features])
하지만 Excel 파일에 필요합니다.
각 잎의 평균을 복용하면 작동하지 않습니까? 나는 또한 선형 회귀 모델을 시도했고 그 차이는 한계 안에 있습니다. 따라서 임의 포리스트를 내보내는 합리적이고 효율적인 방법이 없다면 선형 회귀로 돌아 가야 할 수도 있습니다.
—
Tasos
고맙지 만 LR에서 이런 식으로 알고있었습니다. 답변으로 표시하여 답변으로 표시 할 수 있습니까?
—
Tasos
다른 사람이 유용한 통찰력을 가지고 있는지 확인하기 위해 며칠 동안 떠날 가치가 있습니다. 데이터 과학 스택 교환은 스택 오버플로보다 훨씬 작으므로 통찰력있는 답변을 얻는 데 2-3 일이 걸립니다.
—
AN6U5
decision trees
이므로 선형 회귀를 사용하는 것처럼 하나의 방정식을 얻지 못합니다. 대신if, then, else
마지막 잎을 숫자 값으로 바꾸는 많은 논리와 많은 최종 방정식을 얻게 됩니다. 트리를 시각화하고 모든 논리를 제거 할 수 있더라도이 모든 것이 큰 혼란처럼 보입니다. Excel에서 작업하는 경우 Azure를 사용하여 Excel에서 모델을 훈련시키는 것에 대해 생각해보십시오. 그러나 아마도 Excel 내에서 파이썬을 호출 할 것입니다.