预测 RF 后的数据归一化答案

【问题标题】：data normalization after prediction RF预测 RF 后的数据归一化
【发布时间】：2017-05-20 00:43:24
【问题描述】：

使用 RandomForest 算法进行回归，我在 iternet 中发现，而不是在预测后它们对预测结果进行归一化，这意味着我们假设结果是 pred

pred = pred = pred*(np.exp(-pred/100)*2+1)

你知道为什么要对预测结果进行归一化吗？为什么这个公式以及可以对预测结果进行哪种归一化？

【问题讨论】：

标签： machine-learning normalization random-forest prediction

【解决方案1】：

简而言之：不要做这种随意的事情。

更详细的答案：没有理由进行任何类型的“固定方程”后处理。将 f(x) 应用于您的预测的唯一原因是如果您在训练之前应用了 f^-1(x)。换句话说 - 如果您在训练之前以某种方式转换了数据，则需要对预测应用逆变换以返回原始空间。

只是为了说明所提供的方程有多么无用，请考虑具有负输出的回归问题，例如在 -10000 和 0 之间。假设您的模型并不完美，并根据此“规则”预测 -9900 而不是 -10000 " 你得到 (-9900)*(np.exp(-(-9900)/100)*2+1) ，这是 -200,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000 (-2e47) 行中的东西。

【讨论】：

对不起，我没有很好地理解你的答案，但如果我们假设结果是 -9900，结果将不会是 -2e47，因为我们乘以 exp (-predicted) 而不是 exp (--predicted)我测试了它，这个公式的结果更好我不知道为什么
你使用的是 exp(-predicted)，predicted 是 -9900 所以你得到 exp(9900)，这就是数学的工作原理，如果你在示例中错误地放置了“-”，那么只需更改我预测 9900 的反例，同样的事情也会发生。