【发布时间】:2021-12-12 06:21:05
【问题描述】:
我有一个不平衡的数据集。所以在使用分类器时我的表现很差。这是一个二元类问题,我使用Random forest 作为分类器。 True negative 与 True positive 的比例为 7:1。所以我试图解决这个问题,并使用Subset Evaluator 和Random Forest 并使用BestFirst search 找出重要属性。然后我只使用了我的数据集中的重要属性和类属性,并丢弃了所有其他属性。然后我再次对数据集执行Random Forest。现在它提供了更糟糕的性能。 True negative 和 true positive 的比例是 12:1。我在整个过程中使用 Weka。
我想知道属性评估器是否适用于不平衡数据集?
谢谢。
【问题讨论】:
标签: machine-learning attributes random-forest weka