【问题标题】:How to perform downsampling and upweighting technique?如何执行下采样和加权技术?
【发布时间】:2019-12-13 15:26:00
【问题描述】:

我指的是谷歌的机器学习DataPrep课程,在https://developers.google.com/machine-learning/data-prep/construct/sampling-splitting/imbalanced-data这个关于解决类不平衡问题的讲座中,提到的技术是先下采样,然后上加权。这个讲座讲的是理论,但我找不到它的实际实现。有人可以指导吗?

【问题讨论】:

    标签: machine-learning feature-extraction downsampling oversampling


    【解决方案1】:

    进行加权以校准概率分类器提供的概率,以便可以将 predict_proba 方法的输出直接解释为置信度。

    此处提供了两种校准方法的 Python 实现 - https://scikit-learn.org/stable/auto_examples/calibration/plot_calibration.html#sphx-glr-auto-examples-calibration-plot-calibration-py

    此处提供有关概率校准的更多详细信息 - https://scikit-learn.org/stable/modules/calibration.html

    【讨论】:

    • 这样就解决了类不平衡的问题吧?您还可以在这里查看我的代码特定问题:stackoverflow.com/questions/57375168/…
    • 以上代码不能解决类不平衡问题。向上加权是为了校正下采样后完成的概率。
    猜你喜欢
    • 2015-02-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-06-04
    • 1970-01-01
    • 1970-01-01
    • 2021-09-21
    • 2019-04-22
    相关资源
    最近更新 更多