非结构化数据的文本分析

【问题标题】：Text analysis for unstructured data非结构化数据的文本分析
【发布时间】：2019-07-29 03:32:21
【问题描述】：

我有一个问题我确实有大量的非结构化文本数据，我想将它们分类为不同的部门。

我正在使用朴素贝叶斯分类器

现在，我的问题是我应该在 Y 中传递什么？因为我没有目标值

并且按照语法我必须通过它。

mnb = MultinomialNB()

mnb.fit(X,y)

TypeError: fit() missing 1 required positional argument: 'y'

正如我所说，我没有目标值。

我该怎么做？

我们将不胜感激

【问题讨论】：

【解决方案1】：

朴素贝叶斯分类器是一种监督学习方法，需要您使用预先知道目标的标记数据对其进行训练。然后，您可以在未标记的数据上使用它来预测未来值，但您不能在没有目标值的数据上训练它。

在不了解您的任务的情况下很难推荐不同的方法，但听起来您想研究无监督聚类算法。 k-means 是一个相对简单的入门方法。

【讨论】：