Caffe 快照：.solverstate 与 .caffemodel答案

【问题标题】：Caffe snapshots: .solverstate vs .caffemodelCaffe 快照：.solverstate 与 .caffemodel
【发布时间】：2016-07-30 00:20:11
【问题描述】：

在训练网络时，每 N 次迭代拍摄的快照有两种形式。一个是 .solverstate 文件，我想它就是它听起来的样子，存储损失函数和梯度等的状态。另一个是 .caffemodel 文件，我知道它存储了训练的参数。

如果您想要一个预训练模型，.caffemodel 是您需要的文件，所以我想如果您要测试您的网络，它也是您想要的文件。

W.solverstate 有什么用？在this tutorial 中，您似乎可以从中重新开始训练，但这与使用 .caffemodel 有何不同？ .solverstate 是否也包含与 .caffemodel 相同的信息？换句话说，.caffemodel 只是 .solverstate 的一个子集吗？

【问题讨论】：

标签： deep-learning caffe

【解决方案1】：

solverstate 文件，顾名思义，存储求解器的状态，而不是任何与分类结果相关的信息。模型保存为 caffemodel 文件，您可以使用该文件获取数据的分类结果。如果您想微调您的网络，您可以使用预训练的 caffemodel 文件。这将节省时间，因为您的网络不需要从头开始学习。但是，如果您当前的训练需要停止，由于断电或意外重启，您可以从求解器状态的先前快照恢复您的训练。使用solverstate和caffemodel文件的区别在于前者允许你以预先确定的方式完成你的训练，而后者可能需要改变某些训练参数，例如最大迭代次数。

【讨论】：