【发布时间】:2017-04-29 12:45:11
【问题描述】:
在 Caffe 中训练时,每次迭代都有训练和测试网络输出。我知道这是损失。但是,这是我批次的平均损失还是总损失?这对于分类和回归是否相同?
例如,如果我有一批 100 个训练示例,而我在该迭代中的损失为 100,这是否意味着每个示例的平均损失为 1?
【问题讨论】:
标签: machine-learning neural-network caffe
在 Caffe 中训练时,每次迭代都有训练和测试网络输出。我知道这是损失。但是,这是我批次的平均损失还是总损失?这对于分类和回归是否相同?
例如,如果我有一批 100 个训练示例,而我在该迭代中的损失为 100,这是否意味着每个示例的平均损失为 1?
【问题讨论】:
标签: machine-learning neural-network caffe
训练损失是最后一批训练的平均损失。这意味着,如果您的 mini-batch 中有 100 个训练示例,并且该次迭代的损失为 100,那么每个示例的平均损失为 100。
测试损失也是所有测试批次的平均损失。您指定测试批量大小和测试迭代次数。 Caffe 将获取此类小批量的#iter,评估它们的损失并为您提供平均值。如果#test_iter x batch_size == testset_size,您将获得整个测试集的平均值。
【讨论】: