【问题标题】:Multiple Layer RNN Tensorflow多层 RNN TensorFlow
【发布时间】:2016-04-26 14:16:26
【问题描述】:

我有两层 LSTM 网络。 (config.n_input 为 3,config.n_steps 为 5)

我认为这可能与我输入的形状有关,但我不确定如何解决它,我尝试更改 LSTM 的投影,以便它们具有相同的输入大小,但这并没有工作。

      self.input_data = tf.placeholder(tf.float32, [None, config.n_steps, config.n_input], name='input')

       # Tensorflow LSTM cell requires 2x n_hidden length (state & cell)
       self.initial_state = tf.placeholder(tf.float32, [None, 2*config.n_hidden], name='state')
       self.targets = tf.placeholder(tf.float32, [None, config.n_classes], name='target')

       _X = tf.transpose(self.input_data, [1, 0, 2])  # permute n_steps and batch_size
       _X = tf.reshape(_X, [-1, config.n_input]) # (n_steps*batch_size, n_input)

       input_cell = rnn_cell.LSTMCell(num_units=config.n_hidden, input_size=3, num_proj=300, forget_bias=1.0)
       print(input_cell.output_size)
       inner_cell = rnn_cell.LSTMCell(num_units=config.n_hidden, input_size=300)
       cells = [input_cell, inner_cell]
       cell = rnn.rnn_cell.MultiRNNCell(cells)

尝试运行时返回以下错误。

tensorflow.python.pywrap_tensorflow.StatusNotOK: Invalid argument: Expected size[1] in [0, 0], but got 600
 [[Node: RNN/MultiRNNCell/Cell1/Slice = Slice[Index=DT_INT32, T=DT_FLOAT, _device="/job:localhost/replica:0/task:0/gpu:0"](_recv_state_0/_3, RNN/MultiRNNCell/Cell1/Slice/begin, RNN/MultiRNNCell/Cell1/Slice/size)]]

错误信息的任何更好的解释?或者有什么方法可以轻松解决这个问题?

【问题讨论】:

    标签: python tensorflow


    【解决方案1】:

    将 num_proj 添加到您的初始状态:

    # Tensorflow LSTM cell requires 2x n_hidden length (state & cell)
    self.initial_state = tf.placeholder(tf.float32, [None, 2*config.n_hidden + 300], name='state')
    

    这是一个非常不透明的错误,您最好在 TF GitHub 问题页面上提出它!

    【讨论】: