【发布时间】:2017-11-23 00:07:06
【问题描述】:
想象一下像情感分析这样的二元分类问题。既然我们有标签,我们不能使用实际 - 预测之间的差距作为 RL 的奖励吗?
我想尝试针对分类问题的强化学习
【问题讨论】:
-
使用 RL 解决分类问题有什么意义?我的意思是,你期待任何改进或优势吗?如本问题所述,通常性能应该更差(或者计算成本更高):stackoverflow.com/questions/44594007
标签: machine-learning nlp deep-learning reinforcement-learning