【发布时间】:2014-06-19 01:06:16
【问题描述】:
我有 239 个阳性数据集和 32 个阴性数据集,因为它是与癌症相关的数据,我们只有很少的阴性数据集。现在在应用分类时,确保不平衡的数据集由于数量庞大而过于偏向正数。所以我尝试在 weka 中应用 SMOTE。我也尝试了各种百分比和最近的邻居。令我惊讶的是,而不是负类增加了一些实例,而正类进一步增加,使不平衡的数据集过于偏颇。可以做些什么来克服这一点。并建议我一些其他方法??如果有的话
对于初步研究,我们使用带有 RBF 作为分类器的 LIBSVM
【问题讨论】:
标签: classification weka