【发布时间】:2016-06-20 23:14:02
【问题描述】:
在 TensorFlow 中每第 N 次迭代检查点(即保存快照)模型的最佳做法是什么?
显然,可以使用自定义逻辑调用tf.train.Saver.save,但想知道是否有内部机制?
【问题讨论】:
标签: python tensorflow
在 TensorFlow 中每第 N 次迭代检查点(即保存快照)模型的最佳做法是什么?
显然,可以使用自定义逻辑调用tf.train.Saver.save,但想知道是否有内部机制?
【问题讨论】:
标签: python tensorflow
我会根据我希望保存检查点的频率来做这样的事情:
if (epoch % N) == (N - 1):
saveto=CkptDir+"ckpt/model"+str(N)+".ckpt"
save_path = saverRun.save(session, saveto)
这将保存一个 N epoch 的检查点文件。
【讨论】:
找到解决方案here。可以设置max_to_keep 和keep_checkpoint_every_n_hours 以获得所需的节省。
【讨论】: