【发布时间】:2018-03-25 07:08:03
【问题描述】:
我可以将 sklearn 模型转储到 gridFS :
import gridfs
fs = gridfs.GridFS(db)
gridFS_file = fs.new_file()
joblib.dump(vectorizer, gridFS_file)
这可行,我可以看到存储在我的 Mongo 中的模型。
但我无法直接从 GridFS 读取:
from bson.objectid import ObjectId
new_file = fs.get(ObjectId("59df36ebe46a520014e0771d"))
vectorizer2 = joblib.load(new_file)
这需要很长时间,而且永远不会结束。但是,这很有效(并且很快完成):
with open('vec.pkl', 'wb') as f:
f.write(new_file.read())
vectorizer3 = joblib.load("vec.pkl")
我错过了什么?
【问题讨论】:
标签: python scikit-learn pymongo gridfs joblib