Keras LSTM 中的批量训练

【问题标题】：Batch training in Keras LSTMKeras LSTM 中的批量训练
【发布时间】：2023-11-27 06:09:01
【问题描述】：

如果我在用Keras 制作的LSTM 中使用32 的batch_size，损失函数是应用于每个序列然后平均，还是直接应用于所有序列而不考虑每个序列？

提前致谢。

【问题讨论】：

标签： keras lstm loss

【解决方案1】：

由于 1 的 batch_size 意味着在序列之后更新权重，所以 32 的批量大小意味着在这 32 个序列之后更新权重。

因此，权重仅在这 32 个序列块之后更新，损失为所有这些序列的平均值，否则如果损失将更新到每个序列本身，它实际上将表示具有 batch_size = 的普通 SGD 1.

【讨论】：

谢谢。那么，为每个序列计算损失，平均和反向传播？
是的。即使在 Keras 中，当您看到修改损失时的进度时，它也只会在这个 batch_size 之后进行修改，因此权重也会随之更新，平均误差会被反向传播。

猜你喜欢

如何创建一个变量来指示数据在 r 中的每个列表元素中的位置 2025-11-21
如何在 C++ 中测量内存分配时间？ [关闭] 2025-11-21
如何在jquery点击事件函数中传递变量 2025-11-21
WCF jquery parsererror 未终止的字符串常量响应 2025-11-21
“this”指针总是常量吗？ 2013-04-12
在没有提交按钮/表单的情况下将下拉值传递/获取到 sql 变量中 2025-11-21
十进制 (10,9) 变量不能容纳数字 50 (SQL Server 2008) 2025-11-21
IDocumentQuery 中 documentdb linq 查询中的 OrderBy 2025-11-21
NASA API 在 Excel 中的表格中 2025-11-21
将变量从一个页面（带表单）传递到另一个 php 2025-11-21

相关资源

X3.4 繁体中文 UTF8 20210320下载 2023-03-26
DSKMS在线培训开源视频管理系统 v3.0.6下载 2023-01-18
回到网页顶部的JS代码下载 2022-12-26
Spring Security 2权限配置精讲中文WORD版下载 2022-12-04
HTML5 Canvas实现的彩色肥皂泡浮起动画效果源码下载 2023-02-19

最近更新更多

热门标签

Java Python linux javascript C# Mysql Docker 算法前端 SpringBoot Redis Vue spring .net 设计模式 .net core c++ kubernetes 数据库机器学习大数据数据结构微服务 js 人工智能 Go Android 面试程序员 JVM 云原生后端 ASP.net core 深度学习 CSS k8s git golang PHP devops Nginx Django React mybatis 架构多线程 Spring Boot 云计算 LeetCode 分布式