【发布时间】:2018-01-08 03:45:58
【问题描述】:
我正在尝试学习 LSTM。参加过这个网络课程,读过这本书(https://machinelearningmastery.com/lstms-with-python/)和很多博客......但是,我完全被困住了。我的兴趣是多元 LSTM,我已经阅读了所有我能找到但仍然无法理解的内容。不知道是我傻还是怎么回事……
如果这个确切的问题和一个好的答案已经存在,那么我很抱歉重复发布,但我已经查看并没有找到它......
因为我想真正了解基础知识,所以我在 excel 中创建了一个虚拟数据集,其中每个“y”取决于每个输入 x1 和 x2 的总和,但也取决于时间。据我了解,这是一个多对一的场景。 伪代码:
x1(t) = sin(A(t))
x2(t) = cos(A(t))
tmp(t) = x1(t) + x2(t) (dummy variable)
y(t) = tmp(t) + tmp(t-1) + tmp(t-2) (i.e. sum over the last three steps)
(基本上我想在三个时间步长给定 x1 和 x2 的情况下预测 y(t))
然后将其导出到包含 x1、x2、y 列的 csv 文件
我已经尝试在下面对其进行编码,但显然它不起作用。
我读取数据并将其拆分为 80/20 测试和训练集,分别为 X_train、y_train、X_test、y_test,尺寸为 (217,2)、(217,1)、(54,2)、(54/ 1)
我真正还没有掌握的是时间步长和样本到底是什么,以及在 reshape 和 input_shape 中的使用。在我看过的许多代码示例中,它们只是使用数字而不是定义的变量,这使得很难理解正在发生的事情,特别是如果你想改变一些东西。例如,在我参加的其中一门课程中,重塑的编码是这样的......
X_train = np.reshape(X_train, (1257, 1, 1))
这并没有提供太多信息...
无论如何,当我运行下面的代码时,它会说
ValueError: 无法将大小为 434 的数组重新整形为 (217,3,2)
所以,我知道导致错误的原因,但不知道我需要做什么来修复它。如果我设置 look_back=1 它可以工作,但这不是我想要的。
import numpy as np
import pandas as pd
from keras.models import Sequential
from keras.layers import LSTM
from keras.layers import Dense
# Load data
data_set = pd.read_csv('../Data/LSTM_test.csv',';')
"""
data loaded have three columns:
col 0, col 1: features (x)
col 2: y
"""
# Train/test and variable split
split = 0.8 # 80% train, 20% test
split_idx = int(data_set.shape[0]*split)
# ...train
X_train = data_set.values[0:split_idx,0:2]
y_train = data_set.values[0:split_idx,2]
# ...test
X_test = data_set.values[split_idx:-1,0:2]
y_test = data_set.values[split_idx:-1,2]
# Model setup
look_back = 3 # as that is how y was generated (i.e. sum last three steps)
num_features = 2 # in this case: 2 features x1, x2
output_dim = 1 # want to predict 1 y value
nb_hidden_neurons = 32 # assume something to start with
nb_epoch = 2 # assume something to start with
# Reshaping
nb_samples = len(X_train) # in this case 217 samples in the training set
X_train_reshaped = np.reshape(X_train,(nb_samples, look_back, num_features))
# Create model
model = Sequential()
model.add(LSTM(nb_hidden_neurons, input_shape=(look_back,num_features)))
model.add(Dense(units=output_dim))
model.compile(optimizer = 'adam', loss = 'mean_squared_error')
model.fit(X_train_reshaped, y_train, batch_size = 32, epochs = nb_epoch)
print(model.summary())
谁能解释一下我做错了什么?
正如我所说,我已经阅读了很多博客、问题、教程等,但如果有人有特别好的信息来源,我也很乐意查看。
【问题讨论】: