【发布时间】:2018-12-01 05:14:08
【问题描述】:
在我的数据集中,我有 2 个特征不仅相互关联,而且只有在彼此存在的情况下才有意义。例如,一个是尝试任务的次数,另一个是成功的次数。
如前所述,似乎是我单独采取了 2 个中的一个并没有提供任何信息。我是否应该制定一个方案,如果我在我的 RF 的树中选择其中一个,我会自动包含另一个?
如果是这样,是否可以使用 scikit-learn 的 RF 类来做到这一点?
谢谢!
【问题讨论】:
-
您可以将其作为一项新功能来使用
标签: correlation random-forest feature-selection