【发布时间】:2019-08-20 22:26:26
【问题描述】:
我有 38 个变量,例如氧气、温度、压力等,我的任务是根据这些变量确定每天产生的总产量。当我计算回归系数和截距值时,它们似乎异常且非常高(不切实际)。例如,如果发现“温度”系数为 +375.456,我无法给他们一个含义,即温度增加一个单位会增加 375.456 克的产量。这在我的场景中是不切实际的。然而,预测的准确性似乎是正确的。我想知道,如何解释下面显示的这些巨大的截距(-5341.27355)和巨大的 beta 值。另一个重要的一点是,我删除了多共线性列,而且,我没有缩放变量/标准化它们,因为我需要 beta 系数具有意义,这样我可以说,温度增加一个单位会使产量增加 10g 左右。非常感谢您的意见!
modl.intercept_
Out[375]: -5341.27354961415
modl.coef_
Out[376]:
array([ 1.38096017e+00, -7.62388829e+00, 5.64611255e+00, 2.26124164e-01,
4.21908571e-01, 4.50695302e-01, -8.15167717e-01, 1.82390184e+00,
-3.32849969e+02, 3.31942553e+02, 3.58830763e+02, -2.05076898e-01,
-3.06404757e+02, 7.86012402e+00, 3.21339318e+02, -7.00817205e-01,
-1.09676321e+04, 1.91481734e+00, 6.02929848e+01, 8.33731416e+00,
-6.23433431e+01, -1.88442804e+00, 6.86526274e+00, -6.76103795e+01,
-1.11406021e+02, 2.48270706e+02, 2.94836048e+01, 1.00279016e+02,
1.42906659e-02, -2.13019683e-03, -6.71427100e+02, -2.03158515e+02,
9.32094007e-03, 5.56457014e+01, -2.91724945e+00, 4.78691176e-01,
8.78121854e+00, -4.93696073e+00])
【问题讨论】:
标签: machine-learning linear-regression