【问题标题】:Neural Network Setup and Monitoring in Reinforcement Learning强化学习中的神经网络设置和监控
【发布时间】:2019-06-30 14:19:28
【问题描述】:

我有几个关于使用强化学习训练神经网络的问题,例如 DQN: 1. 在定义我们的模型时,我们应该使用正则化器还是 dropout? 2. 在学习阶段我们可以监控什么?

【问题讨论】:

    标签: neural-network artificial-intelligence reinforcement-learning


    【解决方案1】:
    1. 这个问题并没有真正的通用答案。这实际上取决于您的环境和您的方法,最好的办法是在有无的情况下进行测试并比较结果。
    2. 您始终可以从监控网络丢失和每集的一些环境性能指标开始(如果您的环境是某种游戏,您可以监控每集的分数)

    【讨论】:

    • 首先感谢您的关注。正则化怎么样?到目前为止,我看到的几乎每个示例都使用了没有正则化和 dropout 的 NN。我很好奇它是否有特殊原因
    • 原因可能是代理通常可以无限制地访问环境并且它可能具有“无限”数据 - 所以我们不必担心过度拟合。我不想详细回答您的问题 - 但请查看此答案ai.stackexchange.com/a/8295
    猜你喜欢
    • 1970-01-01
    • 2021-05-06
    • 2012-05-30
    • 1970-01-01
    • 2011-01-28
    • 1970-01-01
    • 2020-11-24
    • 2016-07-11
    • 2020-05-15
    相关资源
    最近更新 更多