【发布时间】:2019-11-16 03:52:33
【问题描述】:
我正在使用 cross_validate sklearn-function 来拟合 RandomForest 分类器。 我想知道是否有办法导出拟合模型以保存它们并导入以预测新数据。
我尝试使用return_estimator=True 选项
[return_estimator : boolean, default False 是否返回 适合每个拆分的估计器。]
然后joblib 保存估算器。但是当我加载保存的模型并尝试将其用于predict 时,出现错误,(见下文)。
rfc = RandomForestClassifier(n_estimators=100)
cv_results = cross_validate(rfc, X_train_std ,Y_train, scoring=scoring, cv=5, return_estimator=True)
rfc_fit = cv_results['estimator']
#save estimated model
savedir = ('C://Users//.......//src//US//')
from sklearn.externals import joblib
filename = os.path.join(savedir, 'final_model.joblib')
joblib.dump(rfc_fit,filename)
rfc_model2 = joblib.load(filename)
bla = rfc_model2.predict(X_test_std)
AttributeError: 'tuple' object has no attribute 'predict'
我想我对return_estimator 的真正回馈感到困惑..
看起来他们不是合适的模型。那么,有没有办法提取交叉验证过程中拟合的模型以便重新使用它们?
谢谢
【问题讨论】:
-
如果我的回答有帮助,请告诉我
-
谢谢!好像没问题!
标签: python pandas scikit-learn random-forest