任务是地图里面导航,让agent从起始点到达指定位置。

 

用了supervised learning + reinforcement learning + lstm

 

用supervised learning当做辅助训练,加速rl训练,用lstm当做memory。实验表明depth construction比较有用。论文中的方法在固定地图和随机地图中都能用。

 

相关文章:

  • 2021-12-04
  • 2021-12-11
  • 2021-06-10
  • 2021-07-12
  • 2021-08-30
  • 2021-11-01
  • 2021-06-11
  • 2021-04-24
猜你喜欢
  • 2021-09-19
  • 2021-08-12
  • 2021-08-10
  • 2021-07-05
  • 2021-05-24
  • 2022-12-23
  • 2021-05-13
相关资源
相似解决方案