【问题标题】:Random Forest not predicting zeros随机森林不预测零
【发布时间】:2019-02-19 08:15:56
【问题描述】:

我正在一个包含很多零的数据集上运行一个随机森林。这些零表示某事物的计数(或不存在),因此与可能被归类为“缺失”的数据相比是有意义的。

当我运行预测时,我发现我的 RF 似乎不愿意预测零,几乎就像它没有将 0 视为数字一样,而是默认为 1。有没有办法解决这个问题?我只是觉得奇怪的是,零在任何时候都没有作为预测出现。

【问题讨论】:

  • 请提供MCV 示例

标签: python random-forest prediction missing-data zero


【解决方案1】:

这对我来说并不奇怪,但这确实取决于您的数据集。 基本上,随机森林输出是训练值的平均值(如果你不知道它是如何计算的,我邀请你寻找一些理论来帮助你理解随机森林是如何计算的......)。因此,除非您的目标几乎完全由零复合或定义非常明确的模式(例如,如果某个特征采用某些特定值,那么目标是始终 0)代表大量训练案例,输出正好为 0 的几率非常低。

话虽如此,如果您的输出预期为整数(例如 0),您可以将其四舍五入。

【讨论】:

    猜你喜欢
    • 2014-08-07
    • 2021-03-21
    • 2019-05-04
    • 2019-07-10
    • 2021-06-23
    • 2016-04-09
    • 2019-07-22
    • 2014-08-17
    相关资源
    最近更新 更多