q 代理正在学习不采取任何行动

【问题标题】：q agent is learning not to take any actionsq 代理正在学习不采取任何行动
【发布时间】：2020-05-24 15:23:45
【问题描述】：

我正在训练一个深度 q 网络来交易股票；它有两种可能的动作； 0：等待，1：没买就买，买了就卖。作为输入，它获取所购买股票的价值、股票的当前价值以及与股票相关的前 5 个时间步长的股票价值。所以像

[5.78, 5.93, -0.1, -0.2, -0.4, -0.5, -0.3]

奖励只是销售价格和购买价格之间的差额。任何其他动作的奖励都是 0，尽管我尝试过让它为负数或其他没有结果的东西。

简单吧？不幸的是，代理总是收敛于采取“0”行动。即使我放大了以盈利或任何数量出售的回报。我真的把我的头发拉出来了，我错过了什么明显的东西吗？

【问题讨论】：

能否在您的问题中包含您的代码？很难抽象地回答。
准确的定义或你的奖励函数是什么？添加一些代码也会有所帮助。
youtube.com/watch?v=6DGNZnfKYnU
增加了奖励函数定义。我可以添加代码，但是哪些代码？有好几百行“相关”代码，我不想只是复制粘贴整个内容并要求您弄清楚。

标签： python neural-network q-learning dqn

【解决方案1】：

虽然代理本身可能有问题，但我编写的第二个代理表现出类似的行为。我终于通过降低学习率解决了这个问题；最后它必须比原来低一千倍左右

【讨论】：

猜你喜欢

在进入交互之前如何在 InteractiveConsole 中执行一些任意 Python 代码 2025-11-21
在 Linux 中出现异常时自动重启或正确处理 socket.io 服务器 2025-11-21
如何正确执行内部有多个块的 performFetchWithCompletionHandler 2025-11-21
如何在不重叠视图的情况下拖动 uiimageview？ 2025-11-21
在客户端用 JavaScript 逐行读取文件 2025-11-21
PowerMockito.whenNew 正在使用参考而不是使用对象 2025-11-21
如何在 appmode 下自动启动 jupyter notebook？ 2025-11-21
使用命名管道绑定为 WCF 服务生成代理类 2025-11-21
如何使用序列在oracle中插入多行 2025-11-21
INT(1) 在 MySQL 中代表什么？ 2025-11-21

相关资源

css3爱心点赞图标动画特效代码下载 2023-07-26
DSKMS在线培训开源视频管理系统 v3.0.6下载 2023-01-18
asp.net 懒人工作通协同网络办公自动化管理系统 v6.35 Access下载 2023-01-05
回到网页顶部的JS代码下载 2022-12-26
德彪钢笔行书 Regular字体,德彪钢笔行书字库-3.0字体下载下载 2023-01-23

最近更新更多

热门标签

Java Python linux javascript C# Mysql Docker 算法前端 SpringBoot Redis Vue spring .net 设计模式 .net core c++ kubernetes 数据库机器学习大数据数据结构微服务 js 人工智能 Go Android 面试程序员 JVM 云原生后端 ASP.net core 深度学习 CSS k8s git golang PHP devops Nginx Django React mybatis 架构多线程 Spring Boot 云计算 LeetCode 分布式