【发布时间】:2017-05-28 23:46:37
【问题描述】:
我在 Keras 中有一个模型需要训练,但这个模型总是会炸毁我的 8GB 小内存并冻结我的计算机。
我已经达到了只训练一个样本(批量大小 = 1)的极限,但它仍然爆炸了。
请假设我的模型没有错误或错误,这个问题不是关于“我的模型有什么问题”。 (是的,较小的模型可以处理相同的数据,但不足以完成任务)。
如何将我的模型一分为二并分别训练每个部分,但在它们之间传播梯度?
有没有可能? (使用theano或tensorflow没有限制)
仅使用 CPU,不使用 GPU。
【问题讨论】:
-
你可以试试云计算来加速。这是我编写的一个模块,如果您有兴趣走这条路,可以轻松地在 AWS 上运行项目。 github.com/losDaniel/spot-connect
标签: python memory-management tensorflow keras theano