【发布时间】:2020-06-19 03:49:39
【问题描述】:
我正在做一个二元分类任务。我的评估数据不平衡,由 appr 组成。 20% 来自第 1 类,80% 来自第 2 类。即使我在每个类类型上都有很好的分类准确度,如 class1 上的 0.602,class2 上的 0.792,如果我计算 class1 上的 f1 分数,我得到 0.46,因为假阳性计数很大。如果我在 class2 上计算它,我得到 f1-score 为 0.84。
我的问题是,在不平衡数据上评估分类任务的最佳实践是什么?我可以获得这些 f1 分数的平均值还是应该选择其中一个?在不平衡数据上评估分类任务的最佳评估指标是什么?
顺便说一句,这些是我的 TP、TN、FN、FP 计数;
TP:115
TN:716
FN:76
FP:188
【问题讨论】:
标签: machine-learning statistics classification precision imbalanced-data