随机森林模型不适用于预测答案

【问题标题】：Random forest model not working for prediction随机森林模型不适用于预测
【发布时间】：2021-03-13 12:56:47
【问题描述】：

我训练了一个随机森林模型来预测标题簇。问题在笔记本中运行，预测的集群是正确的。但是当将随机森林模型上传到烧瓶时，所有输入的预测结果都相同。您想提出一些建议吗？谢谢。

feature_dim = 2 ** 10
vectorizer = TfidfVectorizer(max_features=feature_dim)
vectorizer.fit_transform(df['text'].values)


text = df['text'].values
X = vectorizer.fit_transform(text)   

rf_model = RandomForestClassifier(n_estimators=100)
rf_model.fit(X1_train, y1_train)

pickle.dump(rf_model, open('rf_model.sav', 'wb'))

rf_model = load('rf_model.sav')

titles = [
    "title_1"
    "title_2",
]

X_ti = vectorizer.transform(titles)
y_rf = rf_model.predict(X_ti)
print(y_rf)

结果如下：[8 8 8 8 8 8 8]

是不是没有dump tfidf向量特征造成的？

【问题讨论】：

标签： python nlp random-forest

【解决方案1】：

问题也通过转储矢量化器得到解决。

【讨论】：