GumpYan

1.数据源

SH600519.csv 是用 tushare 模块下载的 SH600519 贵州茅台的日 k 线数据,本次例子中只用它的 C 列数据(如图 1.2.26 所示): 用连续 60 天的开盘价,预测第 61 天的开盘价。这个 excel 表格是使用源码 p37_tushare.py(如图 1.2.27)直接下载的真实数据, 可以在这里写出我们需要的六位股票代码,下载需要的股票历史数据 

 

import tushare as ts
import matplotlib.pyplot as plt
 
df1 = ts.get_k_data(\'600519\', ktype=\'D\', start=\'2010-04-26\', end=\'2020-04-26\')
 
datapath1 = "./SH600519_bak.csv"
df1.to_csv(datapath1)

2.代码实现

(1)

按照六步法: import 相关模块-》读取贵州茅台日 k 线数据到变量 maotai, 把变量 maotai 中前 2126 天数据中的开盘价作为训练数据把变量 maotai 中后 300 天数据中的开盘价作为测试数据

然后对开盘价进行归一化,使送入神经网络的数据分布在 0 到 1 之间;

接下来建立空列表分别用于接收训练集输入特征、 训练集标签、 测试集输入特征、 测试集标签; 

 (2)

继续构造数据。 用 for 循环遍历整个训练数据, 每连续60 天数据作为输入特征 x_train第 61 天数据作为对应的标签 y_train ,一共生成 2066 组训练数据,然后打乱训练数据的顺序并转变为 array 格式继而转变为 RNN 输入要求的维度;

同理, 利用 for 循环遍历整个测试数据, 一共生成 240组测试数据,测试集不需要打乱顺序,但需转变为 array 格式继而转变为 RNN 输入要求的维度。 

训练集构造

 

测试集构造

 

 (3)

用 sequntial 搭建神经网络:

第一层循环计算层记忆体设定 80 个,每个时间步推送h

分类:

技术点:

相关文章: