【问题标题】:Correct approach to machine learning model for robotics机器人机器学习模型的正确方法
【发布时间】:2020-01-22 10:59:46
【问题描述】:

我正在寻找使用哪种模型或方法的起点。 案例如下:

一个有 9 个输入的机器人:

  • -6 个传感器提供距离

  • -检测崩溃的传感器

  • -左电机当前转速
  • -右电机当前转速

输出: 2 个数字(或 2 个布尔值)来控制 2 个电机(左前和右前)

现在我正在考虑让机器人找出不崩溃的方法。 我将 6 个传感器和一个“有效/无效”作为数据输入模型 然后对模型进行训练,以找出当传感器值低于某个数字时,电机需要比另一个电机更快才能避免碰撞输入。另外,我需要告诉模型需要避免崩溃标志。

现在作为平台,我正在考虑使用 raspberry pi,可能具有 azure 连接,所以我可以使用任何我想要的模型

但我要寻找哪种型号?它需要从连续数据中学习。尝试一些东西,写回去,从中学习,然后尝试其他东西。输出可能需要多回归或多二进制。

输入也是如此,多个输入。需要已经从新的数据点中学习。有什么想法吗?

【问题讨论】:

    标签: python azure machine-learning robotics


    【解决方案1】:

    您正在寻找reinforcment learning。有很多关于机器人或游戏 AI 的文献。它是如何工作的,就像你说的那样,持续不断。

    它(代理)有一个环境(传感器、当前速度),他可以执行动作(控制电机),从而导致来自环境的反应。通过给定的操作,它将获得奖励,例如distance from object < before=> +1 else -1。你明白了。通过尝试,失败,它会创建自己的策略(它的行为)来最大化奖励。

    强化中最常用的算法是Q-Learning(其深度学习方面称为 DQN)。

    这是一篇可能与您的问题有关的论文:link

    【讨论】:

      猜你喜欢
      • 2022-01-15
      • 2021-04-15
      • 2016-10-27
      • 1970-01-01
      • 2022-12-10
      • 2021-02-20
      • 1970-01-01
      • 2020-07-19
      • 2020-06-19
      相关资源
      最近更新 更多