【发布时间】:2015-12-04 23:31:10
【问题描述】:
在 weka 中,我分别看到了“是”类和“否”类的 F 度量。但是使用加权平均 F-measure 来比较模型的性能有什么好处。请帮我找到答案:)
【问题讨论】:
标签: weka confusion-matrix
在 weka 中,我分别看到了“是”类和“否”类的 F 度量。但是使用加权平均 F-measure 来比较模型的性能有什么好处。请帮我找到答案:)
【问题讨论】:
标签: weka confusion-matrix
让我们从一个聪明的例子开始,使用机器学习对文本中的蛋白质相互作用进行分类,我们的分类器试图将句子分为两类:(1) 正类 (2) 负类。正类包含描述蛋白质相互作用的句子,负类包含不描述蛋白质相互作用的句子。作为一名研究人员,我的重点将是我的正类分类器的 F 分数。为什么?因为我有兴趣看到我的分类器在对包含蛋白质相互作用的句子进行分类时的表现,我并不关心它对否定句进行分类的能力。因此,我将只考虑正类的 F 分数。
但是,对于像垃圾邮件分类这样的另一个经典问题,我们的分类器将电子邮件分为两类:(1) 火腿和 (2) 垃圾邮件,情况有点不同。作为一名研究人员,我想知道我的分类器对火腿和垃圾邮件进行分类的能力。那时,我可以单独或以汇总方式检查每个班级的 F 分数。 ham 和 spam 类的 F-scores 的加权平均值是检查我们的分类器对这两个类(在这种情况下是两个,对于多类问题阅读所有)类的性能的一种方法。因为加权 F-measure 只是所有 F-measures 的总和,每个 F-measures 根据具有特定类标签的实例数和两个类加权,计算如下:
Weighted F-Measure=((F-Measure for n class X number of instances from n class)+(F-Measure for y class X number of instances from y class))/total instances in dataset.
因此,底线是 - 如果分类对所有类别都敏感,则使用所有类别的 F 分数的加权平均值。
【讨论】: