论文地址:https://arxiv.org/abs/1611.01578

1. 论文思想

强化学习,用一个RNN学一个网络参数的序列,然后将其转换成网络,然后训练,得到一个反馈,这个反馈作用于RNN网络,用于生成新的序列。

2. 整体架构

论文笔记——NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING

3. RNN网络

论文笔记——NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING

4. 具体实现

因为每生成一个网络,都会训练一遍,Google用了800个GPU,训练了12800个网络,它采用的是分布式训练的方法。

论文笔记——NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING

5. 结论

论文笔记——NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING

相关文章:

  • 2021-10-26
  • 2021-12-12
  • 2021-09-02
  • 2021-04-14
  • 2022-01-22
  • 2021-06-12
  • 2021-07-21
  • 2021-09-04
猜你喜欢
  • 2022-01-03
  • 2021-08-07
  • 2021-11-12
  • 2021-10-27
  • 2021-07-12
  • 2021-07-13
  • 2021-05-08
相关资源
相似解决方案