【问题标题】:imbalanced classification using undersampling and oversampling using pytorch python使用 pytorch python 的欠采样和过采样的不平衡分类
【发布时间】:2021-08-24 19:24:05
【问题描述】:

我想同时使用过采样和欠采样技术 我有 6 个班级,样本数量如下: 0级 250000 1级 48000 2 类 40000 3级38000 4级 35000 5 级 7000 我想使用 smot 使所有类平衡且大小相同 0 级 40000 1 级 40000 2 类 40000 3 级 40000 4级 40000 5级 40000 我知道如何对所有数据进行过采样或欠采样,但如何将它们与多类分类一起使用

【问题讨论】:

  • 您是否通过“不平衡学习”检查了 SMOTE 实施? Docs 模型
  • 我检查了它,它适用于对少数类进行过采样,但我想对某些类进行欠采样并对某些类进行过采样
  • 随机选择要欠采样的类的数据点。或者您可能会选择最不同的样本(通过某种度量,例如欧几里得距离),这可能是更好的方法。

标签: python pytorch imbalanced-data smote


【解决方案1】:

我试试这个

ros = RandomUnderSampler()
X, y=ros.fit_resample(mydata, labels)
strategy = {0:40000, 1:40000, 2:40000, 3:40000, 4:40000, 5:40000}
over = SMOTE(sampling_strategy=strategy)
X, y=over.fit_resample(X, y)

【讨论】:

    猜你喜欢
    • 2020-03-11
    • 1970-01-01
    • 2017-10-29
    • 2020-02-09
    • 1970-01-01
    • 2019-09-03
    • 2023-01-29
    • 2020-02-15
    • 2020-08-30
    相关资源
    最近更新 更多