【问题标题】:data normalization after prediction RF预测 RF 后的数据归一化
【发布时间】:2017-05-20 00:43:24
【问题描述】:

使用 RandomForest 算法进行回归,我在 iternet 中发现,而不是在预测后它们对预测结果进行归一化,这意味着我们假设结果是 pred

pred = pred = pred*(np.exp(-pred/100)*2+1)

你知道为什么要对预测结果进行归一化吗?为什么这个公式以及可以对预测结果进行哪种归一化?

【问题讨论】:

    标签: machine-learning normalization random-forest prediction


    【解决方案1】:

    简而言之:不要做这种随意的事情

    更详细的答案: 没有理由进行任何类型的“固定方程”后处理。将 f(x) 应用于您的预测的唯一原因是如果您在训练之前应用了 f^-1(x)。换句话说 - 如果您在训练之前以某种方式转换了数据,则需要对预测应用逆变换以返回原始空间。

    只是为了说明所提供的方程有多么无用,请考虑具有负输出的回归问题,例如在 -10000 和 0 之间。假设您的模型并不完美,并根据此“规则”预测 -9900 而不是 -10000 " 你得到 (-9900)*(np.exp(-(-9900)/100)*2+1) ,这是 -200,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000 (-2e47) 行中的东西。

    【讨论】:

    • 对不起,我没有很好地理解你的答案,但如果我们假设结果是 -9900,结果将不会是 -2e47,因为我们乘以 exp (-predicted) 而不是 exp (--predicted)我测试了它,这个公式的结果更好我不知道为什么
    • 你使用的是 exp(-predicted),predicted 是 -9900 所以你得到 exp(9900),这就是数学的工作原理,如果你在示例中错误地放置了“-”,那么只需更改我预测 9900 的反例,同样的事情也会发生。
    猜你喜欢
    • 1970-01-01
    • 2017-06-27
    • 2018-10-01
    • 1970-01-01
    • 2017-06-06
    • 2017-11-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多