【发布时间】:2018-12-25 13:59:50
【问题描述】:
我正在尝试在同一组输入/自变量上系统地回归几个不同的因变量(国家/地区),并希望使用 Sklearn 在 Python 中以循环方式执行此操作。因变量如下所示:
Europe UK Japan USA Canada
Jan-10 10 13 39 42 16
Feb-10 13 16 48 51 19
Mar-10 15 18 54 57 21
Apr-10 12 15 45 48 18
May-10 11 14 42 45 17
而自变量看起来像这样:
Input 1 Input 2 Input 3 Input 4
Jan-10 90 50 3 41
Feb-10 95 54 5 43
Mar-10 92 52 1 45
Apr-10 91 60 1 49
May-10 90 67 11 49
我发现手动回归它们很容易 + 一次存储一个预测(即欧洲在所有四个输入上,然后是日本等),但我还没有想出如何编写一个可以将它们全部完成的单个循环函数走。我怀疑我可能需要使用列表/字典来存储因变量并逐个调用它们,但不太知道如何以 Pythonic 方式编写它。
单个循环的现有代码如下所示:
x = pd.DataFrame('countryinputs.csv')
countries = pd.DataFrame('countryoutputs.csv')
y = countries['Europe']
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X, y)
y_pred = regressor.predict(X)
【问题讨论】:
-
道歉 - 已编辑并添加了我的初始代码
-
所有国家/地区共享相同的输入?
-
是的,所有国家都应该在同一组输入上进行回归
标签: python scikit-learn regression