【发布时间】:2021-08-24 19:24:05
【问题描述】:
我想同时使用过采样和欠采样技术 我有 6 个班级,样本数量如下: 0级 250000 1级 48000 2 类 40000 3级38000 4级 35000 5 级 7000 我想使用 smot 使所有类平衡且大小相同 0 级 40000 1 级 40000 2 类 40000 3 级 40000 4级 40000 5级 40000 我知道如何对所有数据进行过采样或欠采样,但如何将它们与多类分类一起使用
【问题讨论】:
-
您是否通过“不平衡学习”检查了 SMOTE 实施? Docs 模型
-
我检查了它,它适用于对少数类进行过采样,但我想对某些类进行欠采样并对某些类进行过采样
-
随机选择要欠采样的类的数据点。或者您可能会选择最不同的样本(通过某种度量,例如欧几里得距离),这可能是更好的方法。
标签: python pytorch imbalanced-data smote