【问题标题】:How to apply nltk to categorize questions如何应用 nltk 对问题进行分类
【发布时间】:2015-05-14 14:42:31
【问题描述】:

我有一个从在线网站提取的文本文件中的问题列表。我是 nltk 的新手(在 Python 中),并且正在阅读 (http://http://shop.oreilly.com/product/9780596516499.do) 的初始章节。请任何人帮助我将我的主题分类在不同的标题下。 我不知道问题的标题。那么,接下来如何创建标题和分类呢???

【问题讨论】:

    标签: python nlp data-mining text-mining text-classification


    【解决方案1】:

    您的任务由document clustering(每个问题是一个文档)和cluster labeling(标签指定主题)组成。 请注意,如果您的问题很短和/或难以分离,例如属于类似的类别,那么质量不会那么高。

    查看simple recipe 了解文档聚类和相关问题firstsecond

    作为标签的基线,尝试从聚类词或质心中获取最大 tf-idf 词。

    【讨论】:

      猜你喜欢
      • 2012-11-11
      • 2015-02-03
      • 2019-01-17
      • 2017-04-11
      • 2018-04-07
      • 1970-01-01
      • 1970-01-01
      • 2017-02-04
      • 2018-05-13
      相关资源
      最近更新 更多