【发布时间】:2019-04-12 17:57:29
【问题描述】:
我正在阅读 Glenn Seemann 和 David M Bourg 所著的《游戏开发人员的人工智能》一书,他们在其中使用视频游戏人工智能作为基于规则的学习系统的示例。
基本上,玩家有 3 种可能的移动方式,并以三连击的组合命中。人工智能旨在预测玩家的第三次打击。该系统的规则是所有可能的三步组合。每个规则都有一个与之关联的“权重”。每次系统猜测错误时,规则的权重都会降低。当系统必须选择规则时,它会选择权重最高的规则。
这与基于强化学习的系统有何不同?谢谢!
【问题讨论】:
标签: artificial-intelligence reinforcement-learning