【转载】梯度下降法

梯度下降法[编辑]

（重定向自最速下降法）

梯度下降法是一个最优化算法，通常也称为最速下降法。

目录

[隐藏]

描述[编辑]

有关梯度下降法的描述

梯度下降法，基于这样的观察：如果实值函数【转载】梯度下降法在点处可微且有定义，那么函数在点沿着梯度相反的方向下降最快。

因而，如果

【转载】梯度下降法

对于【转载】梯度下降法为一个够小数值时成立，那么。

考虑到这一点，我们可以从函数【转载】梯度下降法的局部极小值的初始估计出发，并考虑如下序列使得

【转载】梯度下降法

因此可得到

【转载】梯度下降法

如果顺利的话序列【转载】梯度下降法收敛到期望的极值。注意每次迭代步长可以改变。

右侧的图片示例了这一过程，这里假设【转载】梯度下降法定义在平面上，并且函数图像是一个碗形。蓝色的曲线是等高线(水平集)，即函数为常数的集合构成的曲线。红色的箭头指向该点梯度的反方向。（一点处的梯度方向与通过该点的等高线垂直）。沿着梯度下降方向，将最终到达碗底，即函数【转载】梯度下降法值最小的点。

例子[编辑]

梯度下降法处理一些复杂的非线性函数会出现问题，例如Rosenbrock函数

【转载】梯度下降法

其最小值在【转载】梯度下降法处，数值为。但是此函数具有狭窄弯曲的山谷，最小值就在这些山谷之中，并且谷底很平。优化过程是之字形的向极小值点靠近，速度非常缓慢。

下面这个例子也鲜明的示例了"之字"的上升（非下降），这个例子用梯度上升（非梯度下降）法求【转载】梯度下降法的极大值（非极小值，实际是局部极大值）。

缺点[编辑]

由上面的两个例子，梯度下降法的缺点是 [1]:

靠近极小值时速度减慢。
直线搜索可能会产生一些问题。
可能会'之字型'地下降。

参阅[编辑]

参考文献[编辑]

Mordecai Avriel (2003). Nonlinear Programming: Analysis and Methods. Dover Publishing. ISBN 0-486-43227-0.
Jan A. Snyman (2005). Practical Mathematical Optimization: An Introduction to Basic Optimization Theory and Classical and New Gradient-Based Algorithms.Springer Publishing. ISBN 0-387-24348-8

相关文章：

2022-12-23
2021-11-22
2021-11-27

猜你喜欢

2021-05-31
2021-09-16
2022-12-23
2021-11-27
2022-12-23
2021-09-05
2021-07-24

相关资源

下载 2023-03-06
下载 2022-12-31
下载 2023-01-29
下载 2023-01-02

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode