【问题标题】:Attribute evaluator with unbalanced dataset in WekaWeka中具有不平衡数据集的属性评估器
【发布时间】:2021-12-12 06:21:05
【问题描述】:

我有一个不平衡的数据集。所以在使用分类器时我的表现很差。这是一个二元类问题,我使用Random forest 作为分类器。 True negativeTrue positive 的比例为 7:1。所以我试图解决这个问题,并使用Subset EvaluatorRandom Forest 并使用BestFirst search 找出重要属性。然后我只使用了我的数据集中的重要属性和类属性,并丢弃了所有其他属性。然后我再次对数据集执行Random Forest。现在它提供了更糟糕的性能。 True negativetrue positive 的比例是 12:1。我在整个过程中使用 Weka。

我想知道属性评估器是否适用于不平衡数据集?

谢谢。

【问题讨论】:

    标签: machine-learning attributes random-forest weka


    【解决方案1】:

    如果属性子集与多数类别标签高度相关,那么这将加剧不平衡也就不足为奇了。毕竟,您正在删除与少数类标签相关的属性。

    【讨论】:

    • 那么,Subset Evaluator 对高度不平衡的数据没用?
    猜你喜欢
    • 2014-02-26
    • 2014-06-19
    • 2017-02-25
    • 2018-12-14
    • 2019-09-29
    • 2019-05-01
    • 2015-10-26
    • 2016-08-22
    • 2012-06-08
    相关资源
    最近更新 更多