【发布时间】:2016-03-15 13:53:45
【问题描述】:
假设我以前有 200 万个训练示例,我已经花时间用这些示例训练我的模型。现在我又收到了 100 个例子。那么我是否必须用这 100 个示例再次训练这 200 万个示例,或者只是以某种方式记住从初始训练中获得的参数(权重)并在训练 100 个示例中使用它们?
【问题讨论】:
-
这取决于学习的类型。如果您使用批量学习,则必须通过将新数据扩充到旧数据集来重新训练模型。同时,如果您使用在线学习,您可以使用您的第一个模型权重并使用新数据进一步更新它们。
-
@Riyaz 再次在线学习(例如随机梯度下降)使用整个训练数据集,然后对整个数据集进行随机洗牌,但在更新参数时仅使用单个数据点,那么我们如何使用它来运行它只有新的例子?
-
使用您的原始权重作为新模型的初始权重。然后仅使用新数据使用 SGD 训练您的模型。
-
批量学习中也不能这样做吗?
标签: machine-learning linear-regression