机器人机器学习模型的正确方法答案

【问题标题】：Correct approach to machine learning model for robotics机器人机器学习模型的正确方法
【发布时间】：2020-01-22 10:59:46
【问题描述】：

我正在寻找使用哪种模型或方法的起点。案例如下：

一个有 9 个输入的机器人：

输出： 2 个数字（或 2 个布尔值）来控制 2 个电机（左前和右前）

现在我正在考虑让机器人找出不崩溃的方法。我将 6 个传感器和一个“有效/无效”作为数据输入模型然后对模型进行训练，以找出当传感器值低于某个数字时，电机需要比另一个电机更快才能避免碰撞输入。另外，我需要告诉模型需要避免崩溃标志。

现在作为平台，我正在考虑使用 raspberry pi，可能具有 azure 连接，所以我可以使用任何我想要的模型

但我要寻找哪种型号？它需要从连续数据中学习。尝试一些东西，写回去，从中学习，然后尝试其他东西。输出可能需要多回归或多二进制。

输入也是如此，多个输入。需要已经从新的数据点中学习。有什么想法吗？

【问题讨论】：

【解决方案1】：

您正在寻找reinforcment learning。有很多关于机器人或游戏 AI 的文献。它是如何工作的，就像你说的那样，持续不断。

它（代理）有一个环境（传感器、当前速度），他可以执行动作（控制电机），从而导致来自环境的反应。通过给定的操作，它将获得奖励，例如distance from object < before=> +1 else -1。你明白了。通过尝试，失败，它会创建自己的策略（它的行为）来最大化奖励。

强化中最常用的算法是Q-Learning（其深度学习方面称为 DQN）。

这是一篇可能与您的问题有关的论文：link

【讨论】：