【发布时间】:2021-02-18 13:38:27
【问题描述】:
Unity 提供了两种 RL 算法来训练代理:PPO 和 SAC。
我一直在寻找如何编写自己的算法的几个星期,只发现提到了一个包含 Unity Environments 的gym-unity 包装器,我可以使用 Gym 编写我的算法。这个包装器有 0 个有用的文档,所以我无处可去。
我的问题是: (1) 如何将自定义编写的 RL 模型导入统一? (2) 包装器是否有更好的文档?
【问题讨论】:
标签: machine-learning reinforcement-learning deep-learning