【发布时间】:2021-03-13 12:56:47
【问题描述】:
我训练了一个随机森林模型来预测标题簇。问题在笔记本中运行,预测的集群是正确的。但是当将随机森林模型上传到烧瓶时,所有输入的预测结果都相同。 您想提出一些建议吗?谢谢。
feature_dim = 2 ** 10
vectorizer = TfidfVectorizer(max_features=feature_dim)
vectorizer.fit_transform(df['text'].values)
text = df['text'].values
X = vectorizer.fit_transform(text)
rf_model = RandomForestClassifier(n_estimators=100)
rf_model.fit(X1_train, y1_train)
pickle.dump(rf_model, open('rf_model.sav', 'wb'))
rf_model = load('rf_model.sav')
titles = [
"title_1"
"title_2",
]
X_ti = vectorizer.transform(titles)
y_rf = rf_model.predict(X_ti)
print(y_rf)
结果如下:[8 8 8 8 8 8 8]
是不是没有dump tfidf向量特征造成的?
【问题讨论】:
标签: python nlp random-forest