【发布时间】:2018-08-03 14:18:59
【问题描述】:
我正在尝试在 sklearn 上使用 LinearRegression() 改进股票市场预测模型。首先,我是机器学习的新手,我对代码的工作方式有点挣扎:
df = df[["Adj Close"]] #price of closing
df["prediction"]=df[["Adj Close"]].shift(-int(30)) #creating just for 30 days
X=df.drop(["prediction"],1)
X=preprocessing.scale(X)
X_forecast=X[-int(30):]
X=X[:-int(30)]
y=np.array(df["prediction"])
y=y[:-int(30)]
X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, test_size = 0.2) #on fait un test en limitant les données connues et celles inconnues pour eviter l'overfitting
reg=LinearRegression()
reg.fit(X_train,y_train)
forecast_prediction=reg.predict(X_forecast)
print(forecast_prediction)
我不明白如何用这种线性回归来预测某些东西,因为我们在这里只使用一个数据:
np.array(df["prediction"])
【问题讨论】: