sigmod3

强化学习是介于监督学习和非监督学习中间的一种学习方法。

不提供样本标签,对积极步进奖赏,求最大化奖赏,常处理序列效益优化问题。

 

分类:

技术点:

相关文章: