【发布时间】:2016-08-20 23:30:28
【问题描述】:
我的模型有一个小问题 JRip classifier
输出似乎足够好,但我担心高相对绝对误差和根相对平方误差。当我尝试 J48 和 NaiveBayes 时,它也高达 98%。在分类中不是那么重要,我可以就这样离开吗?否则,我该如何改进呢? 成本矩阵为:
0 1
2 0
是什么改善了二等舱 TP 率的结果。 提前感谢您的帮助
【问题讨论】:
标签: classification weka
我的模型有一个小问题 JRip classifier
输出似乎足够好,但我担心高相对绝对误差和根相对平方误差。当我尝试 J48 和 NaiveBayes 时,它也高达 98%。在分类中不是那么重要,我可以就这样离开吗?否则,我该如何改进呢? 成本矩阵为:
0 1
2 0
是什么改善了二等舱 TP 率的结果。 提前感谢您的帮助
【问题讨论】:
标签: classification weka
相对绝对误差(以及类比根相对平方误差)计算为平均绝对误差除以ZeroR classifier 的误差(一个分类器,忽略所有预测变量并简单地选择最频繁的值 - a 在您的情况下)。您可以查看公式here。
如果您查看混淆矩阵,您会看到有719 a cases 和303 b cases。 ZeroR 分类器会将所有案例分类为 a,从而正确获得 70% 的训练数据集。相比之下,您的模型正确率达到了 66% (!)。
相对绝对误差的值在您的情况(分类)中不是很重要,因为误差值本身并不重要(您寻找 1 或 2,不关心预测是否模型计算 1.88 或 1.77只要它选择正确的类)。但是,如上所述,您的模型得分不是很好,超过 100% 的值就是它的一个标志。
至于模型改进,不了解更多信息就很难说。但是您可以尝试不同的算法,例如 KNN。 on the IBM developerworks Blog
【讨论】: