【发布时间】:2013-11-25 15:33:03
【问题描述】:
嗨,我是数据挖掘的新手。我的任务是使用 n-gram 方法对文本文档进行自动分类。
我找不到关于这个主题的合适资源,请帮助我如何继续这个主题,我在哪里可以找到基于 n-gram 分类的教程。
我需要有关此主题的 java 源代码以供理解。
提前致谢。
【问题讨论】:
标签: data-mining n-gram text-classification
嗨,我是数据挖掘的新手。我的任务是使用 n-gram 方法对文本文档进行自动分类。
我找不到关于这个主题的合适资源,请帮助我如何继续这个主题,我在哪里可以找到基于 n-gram 分类的教程。
我需要有关此主题的 java 源代码以供理解。
提前致谢。
【问题讨论】:
标签: data-mining n-gram text-classification
我强烈推荐 Dan Jurafsky 和 Chris Manning 的 Stanford's online NLP course。第 4 章讨论 n-gram,但之前的所有章节都提供了很好的背景知识。
Stanford 也有一些很棒的 open source software 可用于文本分类,从标记化到词性标记。
【讨论】:
【讨论】: