【发布时间】:2017-03-09 18:44:49
【问题描述】:
我想加快我的 LSTM 网络,但是因为我将它用于 OCR(其中序列具有可变长度),所以我不能使用普通的 LSTM 实现。这就是我使用“tf.nn.dynamic_rnn”的原因。
基于 tensorflow (https://github.com/tensorflow/tensorflow/blob/754048a0453a04a761e112ae5d99c149eb9910dd/tensorflow/contrib/cudnn_rnn/python/kernel_tests/cudnn_rnn_ops_benchmark.py#L77) 中的 RNN 基准,CUDNN 实现用于一次创建所有模型(它不像其他使用“tf.nn.rnn”结构)。我认为使用可变长度的 CUDNN 可能是不可能的,但也许有人成功了吗?
其次,这是使用“tf.nn.bidirectional_dynamic_rnn”,因为我想将 Bi-LSTM 用于 OCR。但这应该在实施第一部分后解决。
编辑:看起来“tf.contrib.cudnn_rnn.CudnnLSTM”内部有“双向”实现。所以唯一未知的是CUDNN可以与可变输入序列一起使用。
或者任何使用“CudnnLSTM”的工作示例都会有所帮助。
【问题讨论】:
-
在此处查看 CudnnLSTM 运算符的测试:github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/…。他们会帮助回答您的问题吗?
标签: tensorflow lstm cudnn