【发布时间】:2018-09-24 19:44:57
【问题描述】:
我正面临以下问题。 我有大量文档要使用双向 LSTM 进行编码。每个文档都有不同数量的单词,单词可以被认为是一个时间步长。
在配置双向 LSTM 时,我们需要提供时间序列长度。
当我训练模型时,每个批次的这个值都会不同。
我应该为timeseries_size 选择一个我允许的最大文档大小的数字吗?任何比这更大的文件都不会被编码?
示例配置:
Bidirectional(LSTM(128, return_sequences=True), input_shape=(timeseries_size, encoding_size))
【问题讨论】:
标签: machine-learning nlp keras lstm rnn