强化学习中的神经网络设置和监控

【问题标题】：Neural Network Setup and Monitoring in Reinforcement Learning强化学习中的神经网络设置和监控
【发布时间】：2019-06-30 14:19:28
【问题描述】：

我有几个关于使用强化学习训练神经网络的问题，例如 DQN： 1. 在定义我们的模型时，我们应该使用正则化器还是 dropout？ 2. 在学习阶段我们可以监控什么？

【问题讨论】：

标签： neural-network artificial-intelligence reinforcement-learning

【解决方案1】：

这个问题并没有真正的通用答案。这实际上取决于您的环境和您的方法，最好的办法是在有无的情况下进行测试并比较结果。
您始终可以从监控网络丢失和每集的一些环境性能指标开始（如果您的环境是某种游戏，您可以监控每集的分数）

【讨论】：

首先感谢您的关注。正则化怎么样？到目前为止，我看到的几乎每个示例都使用了没有正则化和 dropout 的 NN。我很好奇它是否有特殊原因
原因可能是代理通常可以无限制地访问环境并且它可能具有“无限”数据 - 所以我们不必担心过度拟合。我不想详细回答您的问题 - 但请查看此答案ai.stackexchange.com/a/8295

猜你喜欢

1970-01-01
2021-05-06
2012-05-30
1970-01-01
2011-01-28
1970-01-01
2020-11-24
2016-07-11
2020-05-15

相关资源

下载 2023-01-29
下载 2023-04-10
下载 2021-06-23

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode