使用 Atari Games 进行深度强化学习：一个 DQN 用于所有游戏还是 49 个 DQN 用于 49 个游戏？答案

【问题标题】：Deep Reinforcement Learning with Atari Games: one DQN for all games or 49 DQNs for 49 games?使用 Atari Games 进行深度强化学习：一个 DQN 用于所有游戏还是 49 个 DQN 用于 49 个游戏？
【发布时间】：2019-11-01 12:32:42
【问题描述】：

我想澄清一下 Nature 2015 上的文章“通过深度强化学习进行人类水平控制”。当我阅读它时，我了解到他们使用具有相同算法、网络架构和超参数的 DQN。伟大的！但他们没有具体说明他们是否从头开始训练每场比赛，因此我们每场比赛获得一个神经网络（意味着 49 场比赛的 49 个神经网络），或者他们是否使用独特的神经网络训练所有比赛（意味着只有一个神经网络可以玩 49 场比赛）。

有人知道正确答案是什么吗？因为根本不是一回事！:)

谢谢，

【问题讨论】：

如果我的帖子回答了你的问题，请设置为正确答案！

标签： reinforcement-learning

【解决方案1】：

在您提到的论文中，针对 49 个游戏训练了 49 个网络：“每个游戏都训练了不同的网络：所有游戏都使用相同的网络架构、学习算法和超参数设置（请参阅扩展数据表 1），表明我们的方法足够强大，可以处理各种游戏，同时只包含最少的先验知识”，这是从论文中引用的。

有些算法只为所有 49 场比赛训练一个网络，例如https://arxiv.org/pdf/1809.04474.pdf

【讨论】：