【发布时间】:2015-06-25 10:55:42
【问题描述】:
我正在使用简单的词袋概念开发一个朴素贝叶斯分类器。我的问题是在朴素贝叶斯或任何其他机器学习场景 'training' 中,分类器很重要。但是,当我已经拥有各种类别的 bag_of_words 时,如何训练朴素贝叶斯分类器。
【问题讨论】:
-
@TimBiegeleisen 我已经阅读了教程。但一个问题仍然存在。假设我有正面和负面的两个班级。现在在我的正类训练数据集中,我没有。积极的字符串和消极的类我也有一个没有。负弦。但在肯定字符串中,并非所有单词都是肯定的。问题就出现了。当我尝试从他们那里取出单词并将它们放入积极的 bag_of_words 时,还会添加一些否定词,这会妨碍以后的分类。
-
@Pritam 是单词的正面还是负面倾斜取决于上下文?如果是这样,您需要将上下文作为特征添加到每个样本(单词)的
X向量中。不然分类器怎么区分?
标签: machine-learning classification naivebayes