【问题标题】:Caffe snapshots: .solverstate vs .caffemodelCaffe 快照:.solverstate 与 .caffemodel
【发布时间】:2016-07-30 00:20:11
【问题描述】:

在训练网络时,每 N 次迭代拍摄的快照有两种形式。一个是 .solverstate 文件,我想它就是它听起来的样子,存储损失函数和梯度等的状态。另一个是 .caffemodel 文件,我知道它存储了训练的参数。

如果您想要一个预训练模型,.caffemodel 是您需要的文件,所以我想如果您要测试您的网络,它也是您想要的文件。

W.solverstate 有什么用?在this tutorial 中,您似乎可以从中重新开始训练,但这与使用 .caffemodel 有何不同? .solverstate 是否也包含与 .caffemodel 相同的信息?换句话说,.caffemodel 只是 .solverstate 的一个子集吗?

【问题讨论】:

    标签: deep-learning caffe


    【解决方案1】:

    solverstate 文件,顾名思义,存储求解器的状态,而不是任何与分类结果相关的信息。模型保存为 caffemodel 文件,您可以使用该文件获取数据的分类结果。如果您想微调您的网络,您可以使用预训练的 caffemodel 文件。这将节省时间,因为您的网络不需要从头开始学习。但是,如果您当前的训练需要停止,由于断电或意外重启,您可以从求解器状态的先前快照恢复您的训练。使用solverstate和caffemodel文件的区别在于前者允许你以预先确定的方式完成你的训练,而后者可能需要改变某些训练参数,例如最大迭代次数。

    【讨论】: