【发布时间】:2011-01-08 17:49:21
【问题描述】:
我必须为计算机科学领域构建一个概念分析器,并使用 Python 的橙色库来进行机器学习。我有一些概念的例子,其中的特征是引理和词性,比如算法|NN|概念。问题是任何其他实际上不是概念的词都被归类为概念,因为缺乏反面例子。将所有其他单词放在学习文件中是不可行的,归类为简单单词而不是概念(这会起作用,但不是一个解决方案)。有什么想法吗?
谢谢。
【问题讨论】:
-
您需要更好地澄清您的问题。您要解决/检测/分类的问题是什么?您的训练数据的性质是什么?词性标注如何帮助您完成任务?你说的负面例子到底是什么意思?
标签: python artificial-intelligence machine-learning data-mining