【问题标题】:How to calculate the accuracy of classes from a 7x7 confusion matrix?如何从 7x7 混淆矩阵计算类的准确性?
【发布时间】:2018-04-16 09:23:18
【问题描述】:

所以我在我的数据集上从朴素贝叶斯分类中得到了以下结果:

然而,我一直在理解如何解释数据。我想查找和比较每个类 (a-g) 的准确性。

我知道使用这个公式可以找到准确性:

但是,让我们来上课吧。如果我取正确分类实例的数量 - 313 - 并将其除以 a 行中的“a”(4953)的总数,得到~6.32%。这是准确度吗?

编辑:如果我们使用列而不是行,我们会得到 313/1199,它给出了 ~26.1%,这似乎是一个更合理的数字。

编辑 2:我已经在 excel 中计算了a 的准确度,使用上面显示的准确度计算,我得到了 84% 的准确度:

这似乎不对,因为成功分类的总体准确率约为 24%

【问题讨论】:

    标签: machine-learning classification weka confusion-matrix


    【解决方案1】:

    不——您计算的只是tp/(tp+fn),即a 类的正确标识总数除以实际a 示例总数。这是召回,而不是准确度。您需要包括其他两个数字。

    fpa 列的其余部分; tn 是非a 行和列中的所有其他数字,即 6x6 子矩阵。这会将所有 35K+ 试验减少为带有标签 anot a 的 2x2 矩阵,这是您已经熟悉的 2x2 混淆矩阵。

    是的,您可以针对七个功能中的每一个重复该缩减。我建议以编程方式进行。


    对 OP 更新的响应

    您的准确性 那么高:您有大量的真阴性,而不是被正确归类为非-的样本一个。

    也许感觉不对,因为我们的经验更侧重于相关课程。还有[处理该焦点的其他统计数据。

    • Recalltp / (tp+fn)——在a 类中的所有项目中,我们正确识别的百分比是多少?这是 6.32% 的数字。
    • Precisiontp / (tp + fp) - 在所有标识为a 类的项目中,实际属于该类的百分比。这是您计算的 26.1% 的数字。

    【讨论】:

    • 我将如何以编程方式执行此操作?
    • 您从 7x7 混淆矩阵中对适当的行和列切片求和。
    • 您目前如何操作Weka?如果您在资源管理器界面中手动运行它,请右键单击结果列表中的结果并选择保存结果缓冲区,然后将文件作为空格分隔文件导入到您在其中的电子表格程序中可以进行计算。
    • 如何在 excel 中自动计算所有类 a-g?我已将混淆矩阵复制到列中
    • (1) 这是一个单独的问题; (2) 您尚未发布您当前的数据和编码尝试; (3) 没有那个......好吧,Stack Overflow 不是从头开始的编码服务。
    猜你喜欢
    • 2017-02-25
    • 2018-04-01
    • 2012-11-12
    • 1970-01-01
    • 2021-06-14
    • 1970-01-01
    • 1970-01-01
    • 2019-01-01
    相关资源
    最近更新 更多