【问题标题】:Sum or average of subgradients?, mini-batch SGD keras次梯度的总和或平均值?,小批量 SGD keras
【发布时间】:2016-12-14 19:18:06
【问题描述】:

我已经搜索了很多关于在使用多层感知器时如何计算 Keras 中小批量的梯度,但似乎找不到答案。我想知道每个小批量的梯度平均值是否用于更新权重和偏差,或者它是否是梯度的总和?

如果有人知道答案并可以提供帮助,我将不胜感激,如果可能的话,请告诉我在哪里可以找到这些信息。

【问题讨论】:

    标签: neural-network keras gradient


    【解决方案1】:

    我认为说损失的平均值或损失的总和是有意义的,而不是梯度的平均值/总和。 而且我认为使用损失的平均值来计算梯度总是安全的。

    【讨论】:

      猜你喜欢
      • 2018-02-09
      • 1970-01-01
      • 2020-06-03
      • 2019-08-10
      • 1970-01-01
      • 1970-01-01
      • 2017-12-22
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多