【发布时间】:2019-12-03 12:21:27
【问题描述】:
我正在关注LSTM tutorial。
为了将我的训练数据分为输入(x)和输出(y),我必须执行以下命令:
X, y = train[:, 0: -1], train[:, -1]
很遗憾,它不起作用,并在打印train[:, 0: -1]时产生以下错误:
> TypeError: '(slice(None, None, None), slice(0, -1, None))' is an invalid key
我尝试用以下命令替换此命令:
X, y = train[:][0: -1], train[:][-1]
但我很确定它不会给出相同的输出,因为它是不合逻辑的(在我的情况下),有多个输入和一个输出。
这是一个带有数据样本的最小可复制代码:
from pandas import DataFrame
from pandas import datetime
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
import numpy
O = [0.701733664614, 0.699495411782, 0.572129320819, 0.613315597684, 0.58079660603, 0.596638918579, 0.48453382119]
Ab = [datetime(2018, 12, 11, 14, 0), datetime(2018, 12, 21, 10, 0), datetime(2018, 12, 21, 14, 0), datetime(2019, 1, 1, 10, 0), datetime(2019, 1, 1, 14, 0), datetime(2019, 1, 11, 10, 0), datetime(2019, 1, 11, 14, 0)]
data = DataFrame(numpy.column_stack([O, Ab]),
columns=['ndvi', 'datetime'])
def fit_lstm(train, batch_size, nb_epoch, neurons):
X, y = train[:, 0: -1], train[:, -1]
X = X.values.reshape(X.shape[0], 1, X.shape[1])
model = Sequential()
model.add(LSTM(neurons, batch_input_shape=(batch_size, X.shape[1], X.shape[2]), stateful=True))
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer='adam')
for i in range(nb_epoch):
model.fit(X, y, epochs=1, batch_size=batch_size, verbose=0, shuffle=False)
model.reset_states()
return model
train, test = data.values[0:-2], data.values[-2:]
print (train[:, 0:-1])
我想要的只是解决这个问题以适应 LSTM 模型:
lstm_model = fit_lstm(train, 1, 3000, 4)
也许,在这种情况下,我必须使用shift(),将最后一个时间步作为输入,将当前时间步作为输出?
像这样:
shift_steps = 1
train_targets = train.shift(-shift_steps)
X, y = train, train_targets
【问题讨论】:
-
如果它是一个无效的键,这意味着你的数据是一个数据框,而不是一个 numpy (2D) 数组。
-
如果你真的想要/需要一个 numpy 数组,请传递
fit_lstm你的数据框实例.values属性:这就是 numpy 数组:fit_lstm(train.values, 1, 3000, 4)。但是,更好的是,尝试使用带有列名的实际数据帧索引(或使用例如.iloc):X, y = train['ndvi'], train['datetime'](在这里猜测哪些列)。 -
请注意,教程某处显示此代码:
X = series.values; train, test = X[0:-12], X[-12:]。 -
我已经把data.values设置为训练了,命令还是不行。
-
@00,也许我必须为训练集重塑数据。这是我在使用
data.values并打印train[:, 0:-1]时遇到的错误:>print (train[:, 0: -1]) IndexError: too many indices for array