梯度下降法[编辑]

(重定向自最速下降法
 

梯度下降法是一个最优化算法,通常也称为最速下降法

 

 

描述[编辑]

【转载】梯度下降法
 
有关梯度下降法的描述

梯度下降法,基于这样的观察:如果实值函数 【转载】梯度下降法 在点 【转载】梯度下降法 处可微且有定义,那么函数 【转载】梯度下降法在 【转载】梯度下降法 点沿着梯度相反的方向 【转载】梯度下降法 下降最快。

因而,如果

【转载】梯度下降法

对于 【转载】梯度下降法 为一个够小数值时成立,那么 【转载】梯度下降法

考虑到这一点,我们可以从函数 【转载】梯度下降法 的局部极小值的初始估计 【转载】梯度下降法 出发,并考虑如下序列 【转载】梯度下降法 使得

【转载】梯度下降法

因此可得到

【转载】梯度下降法

如果顺利的话序列 【转载】梯度下降法 收敛到期望的极值。注意每次迭代步长 【转载】梯度下降法 可以改变。

右侧的图片示例了这一过程,这里假设 【转载】梯度下降法 定义在平面上,并且函数图像是一个形。蓝色的曲线是等高线(水平集),即函数 【转载】梯度下降法 为常数的集合构成的曲线。红色的箭头指向该点梯度的反方向。(一点处的梯度方向与通过该点的等高线垂直)。沿着梯度下降方向,将最终到达碗底,即函数 【转载】梯度下降法 值最小的点。

例子[编辑]

梯度下降法处理一些复杂的非线性函数会出现问题,例如Rosenbrock函数

【转载】梯度下降法

其最小值在 【转载】梯度下降法 处,数值为【转载】梯度下降法。但是此函数具有狭窄弯曲的山谷,最小值 【转载】梯度下降法 就在这些山谷之中,并且谷底很平。优化过程是之字形的向极小值点靠近,速度非常缓慢。

【转载】梯度下降法

下面这个例子也鲜明的示例了"之字"的上升(非下降),这个例子用梯度上升(非梯度下降)法求 【转载】梯度下降法 的极大值(非极小值,实际是局部极大值)。

【转载】梯度下降法【转载】梯度下降法

 

缺点[编辑]

由上面的两个例子,梯度下降法的缺点是 [1]:

  • 靠近极小值时速度减慢。
  • 直线搜索可能会产生一些问题。
  • 可能会'之字型'地下降。

参阅[编辑]

参考文献[编辑]

  • Mordecai Avriel (2003). Nonlinear Programming: Analysis and Methods. Dover Publishing. ISBN 0-486-43227-0.
  • Jan A. Snyman (2005). Practical Mathematical Optimization: An Introduction to Basic Optimization Theory and Classical and New Gradient-Based Algorithms.Springer Publishing. ISBN 0-387-24348-8

相关文章:

  • 2022-12-23
  • 2021-11-22
  • 2021-11-27
猜你喜欢
  • 2021-05-31
  • 2021-09-16
  • 2022-12-23
  • 2021-11-27
  • 2022-12-23
  • 2021-09-05
  • 2021-07-24
相关资源
相似解决方案