【发布时间】:2012-01-24 11:09:30
【问题描述】:
我正在使用朴素贝叶斯分类器对客户支持进行情绪分析。但不幸的是,我在客户支持领域没有大量带注释的数据集。但是我在同一个域中有少量注释数据(大约 100 个正数和 100 个负数)。我也有亚马逊产品评论数据集。
我是否可以使用 mahout 实现加权的朴素贝叶斯分类器,这样我就可以对少量客户支持数据赋予更大的权重,而对亚马逊产品评论数据赋予更小的权重。我猜对上述加权数据集的训练将大大提高准确性。请帮助我。
【问题讨论】:
标签: machine-learning sentiment-analysis mahout naivebayes