【问题标题】:How to train new data set in multivariate linear regression?如何在多元线性回归中训练新数据集?
【发布时间】:2016-03-15 13:53:45
【问题描述】:

假设我以前有 200 万个训练示例,我已经花时间用这些示例训练我的模型。现在我又收到了 100 个例子。那么我是否必须用这 100 个示例再次训练这 200 万个示例,或者只是以某种方式记住从初始训练中获得的参数(权重)并在训练 100 个示例中使用它们?

【问题讨论】:

  • 这取决于学习的类型。如果您使用批量学习,则必须通过将新数据扩充到旧数据集来重新训练模型。同时,如果您使用在线学习,您可以使用您的第一个模型权重并使用新数据进一步更新它们。
  • @Riyaz 再次在线学习(例如随机梯度下降)使用整个训练数据集,然后对整个数据集进行随机洗牌,但在更新参数时仅使用单个数据点,那么我们如何使用它来运行它只有新的例子?
  • 使用您的原始权重作为新模型的初始权重。然后仅使用新数据使用 SGD 训练您的模型。
  • 批量学习中也不能这样做吗?

标签: machine-learning linear-regression


【解决方案1】:

是的,实际上 LR 是一个在线学习模型,因此您可以在训练新的 200 个示例时使用最后一个参数作为初始权重

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-03-03
    • 2018-02-15
    • 1970-01-01
    相关资源
    最近更新 更多