【发布时间】:2021-10-23 00:56:32
【问题描述】:
数据集:
| Team | Opponent | Home/Away | Ground | Match Date | Match Year | Match Period | Margin | Result |
|---|---|---|---|---|---|---|---|---|
| Country A | Country B | Away | Ground1 | 20-09-2016 | 2016 | Sep-16 | 5 wickets | Lost |
| Country C | Country D | Away | Ground2 | 08-07-2012 | 2012 | Jul-12 | 66 runs | Won |
预测的目标列是Result,这是一个二进制分类,其值为Won或Lost
目的是预测给定球队 (team1) 在给定场地与对手 (team2) 的比赛结果是赢还是输,因此用户对 ML 模型的输入将是 团队、对手、地面。
当仅将分类列视为输入时,模型的准确度相当低。
有关仅使用分类变量训练 ML 模型的方法的任何帮助。 谢谢!
【问题讨论】:
标签: python machine-learning classification random-forest decision-tree