【问题标题】:How do I pass test data to a regression equation in python?如何将测试数据传递给python中的回归方程?
【发布时间】:2017-04-12 23:12:34
【问题描述】:

我已经为一个训练数据框 (b) 建立了一个回归方程,它在 collist 中包含所有 X(输入变量)。我的响应变量 - Y 是 SalePrice。

X = b[collist].values
y = b[['SalePrice']]
reg2 = LinearRegression()
reg2.fit(X, y)
(reg2.intercept_, reg2.coef_)

我得到了一个系数数组。

(array([-1003980.93890187]),
 array([[  1.13921901e+01,   6.72094755e-01,   3.57706059e+02,
           9.11889135e+01,   1.74211742e+01,   1.49978955e+01,
           1.01590205e+01,  -2.39999419e+00,   2.27570861e+01,
           ..........
           ..more terms...
           1.88596429e+01,   3.57099213e+01,  -2.91352714e+01,
           2.54343753e+01,   1.79479162e+03,   6.95632849e+02,
           3.97891154e+03,   1.67768978e+03,  -2.06711712e+03,
          -4.70429021e+03]]))

我如何确定哪个系数适用于哪个术语?

另外,我如何在这个方程中传递一个测试数据框并获得响应变量?

对于测试数据,我还有另一个数据框,其中 SalePrice(response) 列不存在。

谢谢。

【问题讨论】:

    标签: python machine-learning regression prediction regression-testing


    【解决方案1】:

    您应该能够zip 带有系数的列名...

    [name, coef for name, coef in zip(b.columns, reg2._coef)
    

    就测试框架上的预测而言,它应该类似于

    reg2.predict(test_df)

    您也可以为样本外的 R 平方调用 score

    reg2.score(test_X, test_y)
    

    只需查找documentation

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-01-07
      • 1970-01-01
      • 2021-09-25
      • 1970-01-01
      • 2017-09-19
      • 1970-01-01
      相关资源
      最近更新 更多