【问题标题】:How do I calculate true positive, true negative, false positive, and false negative如何计算真阳性、真阴性、假阳性和假阴性
【发布时间】:2016-02-03 04:56:12
【问题描述】:

实际上我正在研究specificitysensitivity。我必须计算混淆矩阵。但我不知道如何计算。预测 IO 模型的输出分为正面、负面和中性 3 类。当我的输出有两个以上的类时,谁能告诉我如何计算混淆矩阵。这可能是个愚蠢的问题,所以请指导我如何实现我的目标。

Sensitivity = ( no of true positive)/ ((no of true positive)+(no of false negative))

Sensitivity = ( no of true positive)/ ((no of true positive)+(no of false negative)+(no of false neutral))

我应该用哪个来表示敏感度

谢谢。

【问题讨论】:

标签: analytics prediction confusion-matrix predictionio


【解决方案1】:

术语“肯定”和“否定”仅在二项式分类器中才有意义——真正的肯定是当你得到正确的“是的,这属于这里”时,真正的否定是当你正确得到“不,这不'不属于该类别"。所以只能有两个类别,或者实际上只有一个,以及它的补充。不属于该类别的所有内容都是否定的。那么混淆矩阵是这样的:

   P   N
P  7   3
N  2   9

所以在这个例子中,你有 7 个真阳性和 9 个真阴性。如果分类器对负样本返回正面,则有 2 个误报;同样,有 3 个假阴性。

不过,这可以推广到多项式混淆矩阵。只需将更多单元格添加到矩阵中,为每个组合腾出空间。

    A    B    C
A   7    6    2
B   -   19    1
C   3    9    7

在整个过程中,您得到了分类器的结果。下来,你有每个样本的实际类别。所以你在对角线上有 7 个“真 A”、19 个“真 B”和 7 个“真 C”,而其他人则感到困惑——1 个“假 C”应该是 B,9 个“假 B”应该是 C,等等。

【讨论】:

  • 查看更新后的问题。哪一个是正确的敏感性公式
  • 快速谷歌搜索表明这不是一个成熟的概念。您可以按照here 的建议为每个类别做“猫”与“非猫”,但在这一点上,也许可以问问你的教授。
  • 在你得到答案后改变问题在这里不是很好的形式。也许您应该简单地接受这个答案并在您的新问题中发布一个新问题。不过,这在编程问题的主题之外变得危险了。或许可以试试stats.stackexchange.com(不太熟悉他们的指南,所以先检查一下)。
  • Wikipedia 似乎同意——它特别说这些是用于二进制分类的。
  • 根据您关于混淆矩阵的回答,我坚持使用敏感性公式。这就是为什么我在我的问题中添加了更多内容。
猜你喜欢
  • 2015-09-28
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-04-22
  • 2017-06-08
  • 2021-11-15
  • 2017-01-25
相关资源
最近更新 更多