分类中的高相对绝对误差和根相对平方误差答案

【问题标题】：High Relative absolute error and Root relative squared error in classification分类中的高相对绝对误差和根相对平方误差
【发布时间】：2016-08-20 23:30:28
【问题描述】：

我的模型有一个小问题 JRip classifier

输出似乎足够好，但我担心高相对绝对误差和根相对平方误差。当我尝试 J48 和 NaiveBayes 时，它也高达 98%。在分类中不是那么重要，我可以就这样离开吗？否则，我该如何改进呢？成本矩阵为：

0 1

2 0

是什么改善了二等舱 TP 率的结果。提前感谢您的帮助

【问题讨论】：

标签： classification weka

【解决方案1】：

相对绝对误差（以及类比根相对平方误差）计算为平均绝对误差除以ZeroR classifier 的误差（一个分类器，忽略所有预测变量并简单地选择最频繁的值 - a 在您的情况下）。您可以查看公式here。

如果您查看混淆矩阵，您会看到有719 a cases 和303 b cases。 ZeroR 分类器会将所有案例分类为 a，从而正确获得 70% 的训练数据集。相比之下，您的模型正确率达到了 66% (!)。

相对绝对误差的值在您的情况（分类）中不是很重要，因为误差值本身并不重要（您寻找 1 或 2，不关心预测是否模型计算 1.88 或 1.77只要它选择正确的类）。但是，如上所述，您的模型得分不是很好，超过 100% 的值就是它的一个标志。

至于模型改进，不了解更多信息就很难说。但是您可以尝试不同的算法，例如 KNN。 on the IBM developerworks Blog

可以找到一个很好的示例解释

【讨论】：