【发布时间】:2019-12-01 22:57:06
【问题描述】:
我质疑著名的克利夫兰心脏病数据集标记其对象的方式here
这个数据集非常不平衡(许多对象属于“无病”类)。我注意到许多使用此数据集的论文用于组合所有其他类别并将其简化为二元分类(疾病与非疾病)
是否有其他方法可以处理这种不平衡的类问题,而不是减少类的数量以从分类器中获得好的结果?
【问题讨论】:
标签: machine-learning scikit-learn classification multilabel-classification multiclass-classification