【发布时间】:2019-04-25 12:28:50
【问题描述】:
“通过深度强化学习进行人类水平控制”的深度 q 学习 (dqn) 与“神经拟合 Q 迭代 - 数据高效神经强化学习方法的首次体验”中的神经拟合 q 迭代有什么区别? 链接分别如下。 https://www.nature.com/articles/nature14236.pdf http://ml.informatik.uni-freiburg.de/former/_media/publications/rieecml05.pdf
据我了解,他们似乎在做同样的事情,除了 dqn 每 C 步更新目标网络。
【问题讨论】: