【问题标题】:In what form should I have my data for 1v1 match prediction?我应该以什么形式获取 1v1 比赛预测的数据?
【发布时间】:2020-11-13 21:19:18
【问题描述】:

我目前正在开发一种人工智能来预测电子游戏中 1v1 比赛的获胜者。问题是我不知道我需要以什么形式拥有数据(输入和标签)。 目前我有以下数据:

  • 比赛当天(有第0天)
  • 玩家 1 的姓名
  • 玩家 1 所在的国家/地区
  • 玩家 2 的名字
  • 玩家2所在的国家
  • 获胜者

我也可以得到比赛的分数,但有时它是最好的3,有时是最好的5,所以我不知道它是否可靠。

根据我掌握的数据,我的两个主要问题是:

  • 如果我只是反转玩家列,AI 是否有可能预测两个不同的结果?
  • 如果是,我该如何避免?
  • 我如何对 AI 说我想要的预测只是我呈现给它的两个玩家之一,而不是其他玩家?

提前感谢,我真的很感激

【问题讨论】:

    标签: python machine-learning


    【解决方案1】:

    您的数据似乎是分类的,即使我不完全理解您所说的 player1 和 player2 是什么意思。你有球员的名字或一些技能吗?

    神经网络或任何 AI 算法都适用于数字。他们对现实世界一无所知,例如日期名称(星期一、星期二等)或国家名称。您需要做的是创建这些现实世界问题和数字之间的映射。

    它们是分类的(不能采用连续值),您可以将天数从 0 映射到 N。对于您可以这样做的国家/地区,每个国家/地区都可以有一个唯一的 ID。如果在推理过程中模型接收到训练中不存在的日期或国家/地区,则您必须小心谨慎,这对模型来说是未知的。因此,要么添加所有相关的国家,要么如果您事先不知道这一点,您可以为未知国家和日期的情况添加标签 -1。 对于每个功能,您将有一列,每行代表一个匹配项。在该列中,您必须为该特定功能和匹配对应 ID,然后您可以将此数据传递给 AI。顺便说一句,您可以为不同的功能使用相同的 ID/编号。 (所以你可以 1 代表星期二,另一列 1 可以是瑞士) 回答您的问题:

    1. 是的,理论上,这可能发生。如果你有足够的样本和一个好的模型,模型本身可能会学习它。

    2. 如果可以,您可以向模型输入相对值而不是绝对值。因此,例如,如果您有一些关于球员的技能组合属性/分数,您可以根据这些分数的差异创建数据,而不是将两个分数都输入系统。例如,player1 的射击是 80,player2 的射击是 78。你有一个射击列,你把值 80-78 放在那里,然后模态知道 player1 比 2 好,反之亦然,你可以放 -2 和 thne 模型知道 player2 在该类别中优于 2。另一种方法是在训练数据中对每个匹配进行 2 次。第二个玩家顺序颠倒了。模型也可以从数据中学习到这一点。

    3. 这很容易做到,您的模型不会输出玩家 ID 或与玩家相关的任何内容。你的问题是一个二元分类问题。在任何情况下,您的模型都应输出 0 或 1。0 表示 player1 获胜,1 表示 player2 获胜,然后您可以自行将此输出转换为玩家。

    【讨论】:

    • 非常感谢这个详细的回答。对于球员来说,我只有他们的身份证。如果我理解清楚,人工智能不理解我没有训练的日子意味着人工智能永远无法预测未来比赛的结果?如果是这样,怎么可能做到这一点?如果我将 Day 列更改为 date 列,这会改变什么吗?真的非常感谢!
    • 不客气!正如我所说,您还应该能够将推理数据样本传递给系统。您可以应用各种技巧。 1)您可以调整值。因此,不要传递日期,只需传递比赛是在哪个工作日。然后你将只有 7 个值。 2) 我不确定比赛日期对结果的影响有多大。如果您认为没有相关性,您不妨放弃此功能
    • 对于我的应用程序,日期(或日期)很重要,因为有一段时间没有玩过的玩家应该会得到更差的结果。比如,如果一个球员一年没打球,我让AI预测他现在的成绩,即使他一年前是最好的,AI也不应该只预测他的胜利(不知道你是否理解)
    • 我明白你的意思。感谢您的澄清,然后您可以再次使用您表示此属性的方式。对于每场比赛和球员,您可以添加另一个功能,例如,您可以在其中给出上次比赛的天数。那么你比只给出日期更精确。有一个球员依赖,一些球员比其他球员失去形式更快。数据只是一个特征,不清楚它与概念的关系。现在,每个玩家都有两个功能。并且在测试的时候你还可以计算出最后一次匹配的时间并将其提供给模型
    • 您还可以添加过去一年在过去 9 个月、6 个月、3 个月和一周内进行了多少场比赛等内容。或比赛日期的标准偏差。您可以使用部分或全部选项。而且可能还有更多选择。主要思想是,您可以使用您必须以有意义且易于学习的方式表示它的信息
    猜你喜欢
    • 2012-05-04
    • 2013-03-08
    • 1970-01-01
    • 2020-09-13
    • 1970-01-01
    • 1970-01-01
    • 2022-01-12
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多