【发布时间】:2019-07-18 11:35:19
【问题描述】:
我正在拟合一个简单的多项式回归模型,我想从拟合模型中获取系数。
给定准备代码:
import pandas as pd
from itertools import product
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import make_pipeline
# data creation
sa = [1, 0, 1, 2, 3]
sb = [2, 1, 0, 1, 2]
raw = {'a': [], 'b': [], 'w': []}
for (ai, av), (bi, bv) in product(enumerate(sa), enumerate(sb)):
raw['a'].append(ai)
raw['b'].append(bi)
raw['w'].append(av + bv)
data = pd.DataFrame(raw)
# regression
x = data[['a', 'b']].values
y = data['w']
poly = PolynomialFeatures(2)
linr = LinearRegression()
model = make_pipeline(poly, linr)
model.fit(x, y)
来自this answer,我知道使用 with 可以获得的系数
model.steps[1][1].coef_
>>> array([ 0.00000000e+00, -5.42857143e-01, -1.71428571e+00,
2.85714286e-01, 1.72774835e-16, 4.28571429e-01])
但这提供了一个一维数组,我不确定哪些数字对应于哪些变量。
它们的顺序是 a0、a1、a2、b0、 b1、b2 或作为 a0、b0、a1、b1、a2、b2?
【问题讨论】:
标签: python scikit-learn regression