【发布时间】:2016-10-19 05:43:00
【问题描述】:
我想构建一个包含大量元素的数组 序列数(批量大小)* 字典大小(文件中的唯一单词) 474683 * 22995
每个序列将打开一些 X 位,表示字典中的一个单词
这句话是:“我是最好的国王” 假设字典是:
[我,我,国王,最好的,动物,吐司,...]
序列将如下所示:
[1,1,1,1,1,0,0,...]
我尝试将其导入 keras,但出现错误:
异常:检查模型输入时出错:预期 lstm_input_9 具有 3 个维度,但得到的数组具有形状 (93371, 22995)
从here 我们可以看到 keras 期望: (batch_size, sequence_length, input_dimension)
对此我能做些什么?
如果我尝试构建一个序列长度为 20 的 nunpy 数组,我会收到内存错误(类似于 26gb),我是否应该拆分数组并分别训练每个数组?
【问题讨论】: