【问题标题】:Classification based on categorical features基于分类特征的分类
【发布时间】:2021-10-23 00:56:32
【问题描述】:

数据集:

Team Opponent Home/Away Ground Match Date Match Year Match Period Margin Result
Country A Country B Away Ground1 20-09-2016 2016 Sep-16 5 wickets Lost
Country C Country D Away Ground2 08-07-2012 2012 Jul-12 66 runs Won

预测的目标列是Result,这是一个二进制分类,其值为Won或Lost

目的是预测给定球队 (team1) 在给定场地与对手 (team2) 的比赛结果是赢还是输,因此用户对 ML 模型的输入将是 团队、对手、地面

当仅将分类列视为输入时,模型的准确度相当低。

有关仅使用分类变量训练 ML 模型的方法的任何帮助。 谢谢!

【问题讨论】:

    标签: python machine-learning classification random-forest decision-tree


    【解决方案1】:

    将分类变量转换为二进制,以便 ML 模型可以理解它。我会将匹配列分成两列,每一列都有一个国家,然后将每个国家转换为唯一的二进制或值。然后模型可以理解你的方法

    【讨论】:

    • 是的@Mohamed Afify,这就是它已经完成的方式,但是当仅提供分类变量作为输入时,ML 模型的性能/学习效果不佳
    猜你喜欢
    • 2018-01-08
    • 2019-07-31
    • 2017-04-09
    • 2020-07-27
    • 2019-08-09
    • 2023-01-15
    • 2011-04-07
    • 1970-01-01
    • 2017-08-01
    相关资源
    最近更新 更多