网格世界的深度 Q 学习

【问题标题】：Deep Q-Learning for grid world网格世界的深度 Q 学习
【发布时间】：2023-05-04 00:31:01
【问题描述】：

有没有人实施过深度 Q 学习来解决网格世界问题，其中状态是玩家的 [x, y] 坐标，目标是达到某个坐标 [A, B]。每一步的奖励设置可以是-1，达到[A，B]的奖励设置可以是+10。 [A, B] 始终是固定的。

令人惊讶的是，我在 google 上没有找到这样的实现。我自己使用taxi-v3尝试了DQN，但没有成功。所以，寻找这样的参考实现来解决我的问题。

【问题讨论】：

标签： reinforcement-learning dql q-learning dqn

【解决方案1】：

对于网格世界，不需要深度 Q 学习，这可能是很少有人这样做的原因。但是我发现了一个使用深度 Q 学习和网格世界的教程：https://livebook.manning.com/book/deep-reinforcement-learning-in-action/chapter-3/1

【讨论】：

猜你喜欢

960个网格重叠的div 2025-11-21
在 ASP .NET MVC 中使用关联的 Jquery 进度条 2025-11-21
从 UIPopoverController 外点击后获取边界 2025-11-21
IE11上表格单元格内绝对位置的奇怪行为 2025-11-21
NASA API 在 Excel 中的表格中 2025-11-21
如何检查是否从 iPhone 上的网页安装了应用程序 1970-01-01
如何测试我的应用程序对格式错误的 URL 的响应？ 2025-11-21
产品价格的数据库设计取决于一天中的时间 2025-11-21
COUNTIF 语句：所有工作表的范围 + 单元格引用作为标准 2025-11-21
将 json 格式转换为结构化数据框 2025-11-21

相关资源

回到网页顶部的JS代码下载 2022-12-26
网站优化 SEO教程下载 2023-05-31
从XML生成可与Ajax共同使用的JSON 中文WORD版下载 2023-09-12
HTML5 Canvas实现的彩色肥皂泡浮起动画效果源码下载 2023-02-19
HTML5 canvas实现的全屏酷炫星空背景动画特效源码下载 2022-12-21

最近更新更多

热门标签

Java Python linux javascript C# Mysql Docker 算法前端 SpringBoot Redis Vue spring .net 设计模式 .net core c++ kubernetes 数据库机器学习大数据数据结构微服务 js 人工智能 Go Android 面试程序员 JVM 云原生后端 ASP.net core 深度学习 CSS k8s git golang PHP devops Nginx Django React mybatis 架构多线程 Spring Boot 云计算 LeetCode 分布式