【问题标题】:MinMax scaling the targetMinMax 缩放目标
【发布时间】:2020-05-23 12:05:06
【问题描述】:


我对某些特征应用了线性回归,通过 10 倍交叉验证来预测目标。
MinMax 尺度应用于特征和目标。
然后将功能标准化。
当我运行模型时,r2 等于 0.65,MSE 为 0.02。
但是当我使用没有 MinMax 缩放的目标时,我得到了相同的 r2,但 MSE 增加到 18。
我的问题是,在数据预处理方面,我们是否必须像处理特征一样处理目标?以上哪个值是正确的?因为在没有缩放目标的情况下,mse 变得更大了。
有人说我们也必须扩大目标,而另一些人则说不。

提前致谢。

【问题讨论】:

  • 不,您不需要对目标变量应用任何转换,而是选择适当的评估方法来检查模型性能。
  • 非常感谢。但是你的意思是其他矩阵吗?这样的MAE,?

标签: python machine-learning scikit-learn linear-regression


【解决方案1】:

无论你是否扩展你的目标都会改变你的错误的“意义”。例如,考虑 2 个不同的目标,一个是 [0, 100],另一个是 [0, 10000]。如果您针对它们运行模型(没有缩放),则 20 的 MSE 对这两个模型意味着不同的事情。前一种情况是灾难性的,而后一种情况是相当不错的。

因此,目标范围 [0, 1] 的 MSE 低于原始值这一事实并不令人惊讶。

同时,r2 值与范围无关,因为它是使用方差计算的。

缩放允许您比较不同目标的模型性能等。

此外,对于某些模型类型(如 NN),缩放会更重要。

希望对你有帮助!

【讨论】:

  • 是的,它有帮助。谢谢。那么我应该按原样使用它们吗?
  • 那么正确的答案应该是视情况而定,但是你可以按原样使用它们,只要注意含义,例如如果你使用SGD 时的学习率.如果你的特征被缩放,但目标不是,你的系数必须更大等等。
猜你喜欢
  • 1970-01-01
  • 2018-11-05
  • 1970-01-01
  • 2013-05-06
  • 2021-07-12
  • 1970-01-01
  • 1970-01-01
  • 2020-05-28
  • 2016-01-01
相关资源
最近更新 更多