【问题标题】:Deep Reinforcement Learning with Atari Games: one DQN for all games or 49 DQNs for 49 games?使用 Atari Games 进行深度强化学习:一个 DQN 用于所有游戏还是 49 个 DQN 用于 49 个游戏?
【发布时间】:2019-11-01 12:32:42
【问题描述】:

我想澄清一下 Nature 2015 上的文章“通过深度强化学习进行人类水平控制”。当我阅读它时,我了解到他们使用具有相同算法、网络架构和超参数的 DQN。伟大的!但他们没有具体说明他们是否从头开始训练每场比赛,因此我们每场比赛获得一个神经网络(意味着 49 场比赛的 49 个神经网络),或者他们是否使用独特的神经网络训练所有比赛(意味着只有一个神经网络可以玩 49 场比赛)。

有人知道正确答案是什么吗?因为根本不是一回事!:)

谢谢,

【问题讨论】:

  • 如果我的帖子回答了你的问题,请设置为正确答案!

标签: reinforcement-learning


【解决方案1】:

在您提到的论文中,针对 49 个游戏训练了 49 个网络:“每个游戏都训练了不同的网络:所有游戏都使用相同的网络架构、学习算法和超参数设置(请参阅扩展数据表 1) ,表明我们的方法足够强大,可以处理各种游戏,同时只包含最少的先验知识”,这是从论文中引用的。

有些算法只为所有 49 场比赛训练一个网络,例如https://arxiv.org/pdf/1809.04474.pdf

【讨论】:

    猜你喜欢
    • 2023-01-09
    • 2017-10-03
    • 2019-10-28
    • 2019-06-03
    • 1970-01-01
    • 1970-01-01
    • 2016-09-26
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多