【问题标题】:Text analysis for unstructured data非结构化数据的文本分析
【发布时间】:2019-07-29 03:32:21
【问题描述】:

我有一个问题 我确实有大量的非结构化文本数据,我想将它们分类为不同的部门。

我正在使用朴素贝叶斯分类器

现在,我的问题是我应该在 Y 中传递什么?因为我没有目标值

并且按照语法我必须通过它。

mnb = MultinomialNB()

mnb.fit(X,y)

TypeError: fit() missing 1 required positional argument: 'y'

正如我所说,我没有目标值。

我该怎么做?

我们将不胜感激

【问题讨论】:

  • 我的错,一定会这样做谢谢

标签: python classification naivebayes


【解决方案1】:

朴素贝叶斯分类器是一种监督学习方法,需要您使用预先知道目标的标记数据对其进行训练。然后,您可以在未标记的数据上使用它来预测未来值,但您不能在没有目标值的数据上训练它。

在不了解您的任务的情况下很难推荐不同的方法,但听起来您想研究无监督聚类算法。 k-means 是一个相对简单的入门方法。

【讨论】:

  • 我们可以用这个算法进行无监督分类。 K 表示也很有用,无论如何感谢您的帮助
猜你喜欢
  • 2017-07-12
  • 2011-03-10
  • 1970-01-01
  • 1970-01-01
  • 2015-07-26
  • 1970-01-01
  • 2017-12-19
  • 1970-01-01
  • 2011-08-18
相关资源
最近更新 更多