【问题标题】:F1 - score with imbalanced dataF1 - 数据不平衡得分
【发布时间】:2020-06-19 03:49:39
【问题描述】:

我正在做一个二元分类任务。我的评估数据不平衡,由 appr 组成。 20% 来自第 1 类,80% 来自第 2 类。即使我在每个类类型上都有很好的分类准确度,如 class1 上的 0.602,class2 上的 0.792,如果我计算 class1 上的 f1 分数,我得到 0.46,因为假阳性计数很大。如果我在 class2 上计算它,我得到 f1-score 为 0.84。

我的问题是,在不平衡数据上评估分类任务的最佳实践是什么?我可以获得这些 f1 分数的平均值还是应该选择其中一个?在不平衡数据上评估分类任务的最佳评估指标是什么?

顺便说一句,这些是我的 TP、TN、FN、FP 计数;

TP:115

TN:716

FN:76

FP:188

【问题讨论】:

    标签: machine-learning statistics classification precision imbalanced-data


    【解决方案1】:

    我不确定这是否是您要查找的内容,但由于您要从中获取性能指标的数据不平衡,您可以尝试应用加权测量,例如加权 f1 分数。 从 scikit-learn 中,f1-score 具有“加权”选项,它考虑每个标签的实例数。这样您可以获得平均 F1 分数。

    https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html

    希望对你有帮助!

    【讨论】:

    • 非常感谢,看来这就是我要找的。我将调查库并使用参数。
    猜你喜欢
    • 2021-04-09
    • 2019-04-23
    • 2020-10-09
    • 1970-01-01
    • 2021-07-02
    • 2016-05-17
    • 1970-01-01
    • 2021-11-04
    • 1970-01-01
    相关资源
    最近更新 更多