向后传播：解析二阶导数值得计算吗？

【问题标题】：Backwards Propagation: are analytical second derivatives worth calculating?向后传播：解析二阶导数值得计算吗？
【发布时间】：2026-02-13 09:25:01
【问题描述】：

我理解我们通常不使用二阶导数信息的原因是，Hessian 可能非常大，层数和权重更多，导致计算成本高，因此首选无 Hessian 方法。我的问题是文献所指的计算费用是否是假设二阶导数是以数值方式计算的结果？因此，如果取而代之的是，被评估的目标函数产生了简洁的解析二阶导数，那么即使有大量隐藏层，基于牛顿的方法是否可以在计算上易于处理以估计 ANN 参数？还是纯粹是 Hessian 的大小 - 以及为更新算法（！）反转它的需要/费用 - 这是使用基于梯度的方法的决定因素？

【问题讨论】：

标签： machine-learning neural-network mathematical-optimization hessian-matrix

【解决方案1】：

为了使用二阶优化方法，您应该计算 Hessian 矩阵的逆。有两个问题：

Hessian 有 O(N²) 个参数，这使得计算变得更加困难（在内存和时间复杂度方面）。即使您在 O(1) 时间内计算每一个（即使用解析公式计算导数），您仍然需要计算它们的二次量。
矩阵求逆是quite slow 运算，它比仅计算所有Hessian 的值。

【讨论】：

猜你喜欢

`scipy.misc.comb` 比临时二项式计算快吗？ 2026-02-15
从另外两个二维向量计算这个新的二维向量。（见图） 1970-01-01
名称实体解析算法 2026-02-03
在pyshark中计算TCP重传 2026-01-22
如何计算数组内的值？ [复制] 2026-02-06
计算机还使用 Z80 CPU 吗？ 2026-01-29
阈值计算的优化 2026-01-06
解析树中的一元和二元减号 2026-01-26
postgreSQL解释解析函数 2026-01-19

相关资源

Leetcode 前 300 题算法题解析 (Java) 完整版PDF下载 2023-02-22
视频地址解析源码|FLV解析 php版 v1.0下载 2023-07-11
GoF 23种设计模式解析附源代码示例下载 2023-05-18
Android数据格式解析对象JSON用法 WORD版下载 2022-12-09
Godaddy 域名解析中文使用指导pdf版 [已测]下载 2023-02-26

最近更新更多

热门标签

Java Python linux javascript C# Mysql Docker 算法前端 SpringBoot Redis Vue spring .net 设计模式 .net core c++ kubernetes 数据库机器学习大数据数据结构微服务 js 人工智能 Go Android 面试程序员 JVM 云原生后端 ASP.net core 深度学习 CSS k8s git golang PHP devops Nginx Django React mybatis 架构多线程 Spring Boot 云计算 LeetCode 分布式