【问题标题】:Python - Predicting football matchesPython - 预测足球比赛
【发布时间】:2022-01-12 00:03:33
【问题描述】:

我对 python 和 pandas 还很陌生,但我仍然很挣扎。我正在参加的课程给了我一个对我来说似乎不可能完成的任务,我希望有人能帮助我。

我有一个数据框(很简单,它包含整个第 16 季的结果):

    season   date        team1          team2                score1   score2   result
12  2016    2016-08-13  Hull City       Leicester City       2.0    1.0        team1_win
13  2016    2016-08-13  Arsenal         Swansea City         0.0    1.0        team2_win
14  2016    2016-08-13  Southampton     Manchester Utd       1.0    1.0        draw
15  2016    2016-08-13  Middlesbrough   Stoke City           1.0    1.0        draw
16  2016    2016-08-13  Crystal Palace  West Bromwich Albion 0.0    1.0        team2_win
... ... ... ... ... ... ... ...

现在,我想预测一下,阿森纳和曼彻斯特在上赛季阿森纳-曼彻斯特的比赛中各进多少球。 (它可能不适用于我在这里提供的部分数据)这是通过计数回归来完成的。

我尝试使用从另一个示例中获得的代码,但失败了:

modelArs = smf.poisson("score1 ~ score2 + team2", data=train_data)
resultArs = modelManc.fit();

而且我知道这可能是我在那里所做的全部 bs,但我完全迷失了。

第二个任务是根据决策树显示哪支球队将获胜。

第三个任务是使用 mnlogit 回归来显示每支球队平局和获胜的概率。

我知道我要求很多,但任何帮助对我都有很大帮助。还包括一些关于你实际做了什么的信息会对我有所帮助。我只是想以某种方式通过课程,然后用 python 完成。

【问题讨论】:

    标签: python pandas forecasting poisson


    【解决方案1】:

    首先你需要对分类变量进行热编码,例如team1、team2、result 热编码只不过是将具有有限可能值的自变量转换为数值形式。

    请参阅此链接了解热编码的工作原理:Hot encoding

    在此数据中,某些变量(例如分数)似乎无用,因为您在需要预测时无法访问分数,因此可以省略它们。并且这个模型可以被训练用于学习目的,但它不会有效地使用这么多的属性,因为游戏的结果并不完全依赖于 [season,date,team1,team2] 之类的属性,您需要考虑很多因素考虑到。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2013-03-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-11-01
      • 1970-01-01
      • 1970-01-01
      • 2021-11-29
      相关资源
      最近更新 更多