如何将测试数据传递给python中的回归方程？答案

【问题标题】：How do I pass test data to a regression equation in python?如何将测试数据传递给python中的回归方程？
【发布时间】：2017-04-12 23:12:34
【问题描述】：

我已经为一个训练数据框 (b) 建立了一个回归方程，它在 collist 中包含所有 X（输入变量）。我的响应变量 - Y 是 SalePrice。

X = b[collist].values
y = b[['SalePrice']]
reg2 = LinearRegression()
reg2.fit(X, y)
(reg2.intercept_, reg2.coef_)

我得到了一个系数数组。

(array([-1003980.93890187]),
 array([[  1.13921901e+01,   6.72094755e-01,   3.57706059e+02,
           9.11889135e+01,   1.74211742e+01,   1.49978955e+01,
           1.01590205e+01,  -2.39999419e+00,   2.27570861e+01,
           ..........
           ..more terms...
           1.88596429e+01,   3.57099213e+01,  -2.91352714e+01,
           2.54343753e+01,   1.79479162e+03,   6.95632849e+02,
           3.97891154e+03,   1.67768978e+03,  -2.06711712e+03,
          -4.70429021e+03]]))

我如何确定哪个系数适用于哪个术语？

另外，我如何在这个方程中传递一个测试数据框并获得响应变量？

对于测试数据，我还有另一个数据框，其中 SalePrice(response) 列不存在。

谢谢。

【问题讨论】：

标签： python machine-learning regression prediction regression-testing

【解决方案1】：

您应该能够zip 带有系数的列名...

[name, coef for name, coef in zip(b.columns, reg2._coef)

就测试框架上的预测而言，它应该类似于

reg2.predict(test_df)

您也可以为样本外的 R 平方调用 score

reg2.score(test_X, test_y)

只需查找documentation。

【讨论】：