Momentum是为了对冲mini-batch带来的抖动。

RMSprop是为了对hyper-parameter进行归一,均方根反向传播(RMSProp)

这两个加起来就是Adam

看原始的RMSProp算法: 
adam算法

再看算法:其实就是Momentum+RMSProp的结合,然后再修正其偏差。 
adam算法

adam算法 

相关文章:

  • 2022-01-17
  • 2021-09-12
  • 2021-08-10
  • 2021-04-17
  • 2021-10-19
  • 2021-06-18
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-04-17
  • 2021-05-20
  • 2021-07-09
  • 2021-09-17
相关资源
相似解决方案