【发布时间】:2017-04-12 23:12:34
【问题描述】:
我已经为一个训练数据框 (b) 建立了一个回归方程,它在 collist 中包含所有 X(输入变量)。我的响应变量 - Y 是 SalePrice。
X = b[collist].values
y = b[['SalePrice']]
reg2 = LinearRegression()
reg2.fit(X, y)
(reg2.intercept_, reg2.coef_)
我得到了一个系数数组。
(array([-1003980.93890187]),
array([[ 1.13921901e+01, 6.72094755e-01, 3.57706059e+02,
9.11889135e+01, 1.74211742e+01, 1.49978955e+01,
1.01590205e+01, -2.39999419e+00, 2.27570861e+01,
..........
..more terms...
1.88596429e+01, 3.57099213e+01, -2.91352714e+01,
2.54343753e+01, 1.79479162e+03, 6.95632849e+02,
3.97891154e+03, 1.67768978e+03, -2.06711712e+03,
-4.70429021e+03]]))
我如何确定哪个系数适用于哪个术语?
另外,我如何在这个方程中传递一个测试数据框并获得响应变量?
对于测试数据,我还有另一个数据框,其中 SalePrice(response) 列不存在。
谢谢。
【问题讨论】:
标签: python machine-learning regression prediction regression-testing