【发布时间】:2013-08-24 02:34:18
【问题描述】:
我有一些 cmets,我想将它们分类为正面或负面。 到目前为止,我有一个带注释的数据集。
问题是前 100 行被归类为正数,其余 100 行被归类为负数。
我正在使用 SQL Server Analysis-2008 R2。 Class 属性有 2 个值,POS-表示正数,NEG-表示负数。
我还使用最大输入/输出属性=0(想使用所有属性)的朴素贝叶斯算法进行分类,测试集最大案例设置为 30%。提升图表的当前分数是 0.60。
为了获得更好的分类准确度,我是否必须将它们混合在一起,例如 2 个 POS 后跟 1 个 NEG?
【问题讨论】:
标签: testing dataset ssas classification bayesian