【问题标题】:Text classification without machine learning, deep learning无需机器学习、深度学习的文本分类
【发布时间】:2021-06-17 09:44:16
【问题描述】:

我想做一个文本分类器。但是没有使用任何找到的分类算法。也许我会使用 twitter 数据进行分类。因此,我必须在没有训练数据集的情况下以某种方式进行分类。现在我正在考虑使用词频进行分类。我找不到任何符合我想法的项目。我需要任何项目或文章你能帮我吗

【问题讨论】:

  • 我认为您的目标存在一些混淆:首先,使用词频进行分类很常见,但这与分类算法无关,与特征有关。其次,如果你打算做一个分类器,除非你已经发明了一种新的分类方法,否则你需要使用已知的分类算法……否则你根本就没有做分类。为了清楚起见,我建议你更准确地考虑你想做什么,因为目前你的计划太模糊了。

标签: python nlp text-classification


【解决方案1】:

哇!首先,这是一项艰巨的任务,并且考虑到机器学习通常的效果如何,对于此类任务,我敦促您尝试为您的分类器找到训练数据并使用机器学习(我发现 Textblob 非常好用且易于使用文本分类库)。

要更直接地回答您的问题,您确实必须对这个问题进行抽象思考,因为它们是您可以尝试产生可靠结果的大量潜在事物。虽然 Word2Vec 通过机器学习工作,但其中包含许多有趣且有用的概念。有关更多详细信息,请参阅维基百科页面 here。例如,您可以查看“词嵌入”。此外,可能会用到余弦相似度等概念。

编码愉快!

【讨论】:

    猜你喜欢
    • 2021-12-06
    • 2017-12-25
    • 2020-03-18
    • 2020-03-06
    • 2019-09-23
    • 2013-11-07
    • 2023-01-03
    • 2020-05-04
    • 1970-01-01
    相关资源
    最近更新 更多