【问题标题】:Random forest model not working for prediction随机森林模型不适用于预测
【发布时间】:2021-03-13 12:56:47
【问题描述】:

我训练了一个随机森林模型来预测标题簇。问题在笔记本中运行,预测的集群是正确的。但是当将随机森林模型上传到烧瓶时,所有输入的预测结果都相同。 您想提出一些建议吗?谢谢。

feature_dim = 2 ** 10
vectorizer = TfidfVectorizer(max_features=feature_dim)
vectorizer.fit_transform(df['text'].values)


text = df['text'].values
X = vectorizer.fit_transform(text)   

rf_model = RandomForestClassifier(n_estimators=100)
rf_model.fit(X1_train, y1_train)

pickle.dump(rf_model, open('rf_model.sav', 'wb'))

rf_model = load('rf_model.sav')

titles = [
    "title_1"
    "title_2",
]

X_ti = vectorizer.transform(titles)
y_rf = rf_model.predict(X_ti)
print(y_rf)

结果如下:[8 8 8 8 8 8 8]

是不是没有dump tfidf向量特征造成的?

【问题讨论】:

    标签: python nlp random-forest


    【解决方案1】:

    问题也通过转储矢量化器得到解决。

    【讨论】:

      猜你喜欢
      • 2019-07-10
      • 2016-04-09
      • 2014-08-07
      • 2019-02-19
      • 2021-03-21
      • 2019-05-04
      • 2021-06-23
      • 2014-08-17
      相关资源
      最近更新 更多