【发布时间】:2017-03-26 17:09:32
【问题描述】:
我想知道最近版本的 scikit-learn 包中是否有平衡随机森林 (BRF) 的实现。 BRF 用于数据不平衡的情况。它与普通 RF 一样工作,但对于每次引导迭代,它通过欠采样来平衡流行类。例如,给定两个类 N0 = 100 和 N1 = 30 个实例,在每次随机抽样时,它从第一类抽取(替换)30 个实例,从第二类抽取相同数量的实例,即它在平衡数据集。欲了解更多信息please refer to this paper。
RandomForestClassifier() 确实有 'class_weight=' 参数,它可能设置为 'balanced',但我不确定它是否与自举训练样本的下采样有关。
【问题讨论】:
-
我们正在努力。 imblearn 目前是一个很好的解决方案。
标签: scikit-learn classification random-forest