【发布时间】:2016-12-01 01:58:42
【问题描述】:
我正在尝试运行 A3C 强化学习算法的开放代码以在 A3C code 中学习 A3C
但是,我遇到了几个错误,除了一个,我可以修复。
在代码中,使用了 tf.Variable 的成员函数 ref() (1,2),但在最近的 tensorflow 版本 0.12rc 中,该函数似乎已被弃用。
所以我不知道替换它的最佳方法是什么(我不明白作者为什么使用ref())。当我只是将它更改为变量本身时(例如v.ref() 到v),没有错误,但奖励没有改变。它似乎无法学习,我猜是因为变量没有正确更新。
请告诉我修改代码的正确方法是什么。
【问题讨论】:
标签: python python-2.7 tensorflow