【问题标题】:Training a machine learning model on multiple CSV files?在多个 CSV 文件上训练机器学习模型?
【发布时间】:2020-02-16 08:50:27
【问题描述】:

我想在多个唯一的 csv 文件上训练机器学习模型。每个文件都是来自篮球比赛的时间序列数据的集合。我想训练一个模型来查看每场比赛并能够预测结果。我是否应该简单地告诉 sci kit learn 或其他软件包遍历感兴趣的文件夹中的文件并在每个文件上运行回归?先感谢您。

【问题讨论】:

  • 添加一些代码,以明确您的要求。

标签: python pandas machine-learning scikit-learn pytorch


【解决方案1】:

如果所有文件都包含相同的功能,您可以将它们连接起来。如果某些特征的预处理方式不同(例如,它们在不同的文件中具有不同的范围),则应在连接之前使它们保持一致。然后使用得到的大数据框/数组进行模型训练。 另外,考虑改组行。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-07-12
    • 1970-01-01
    • 2019-02-08
    • 2017-09-21
    • 2021-10-01
    • 2017-09-13
    • 2011-02-15
    • 1970-01-01
    相关资源
    最近更新 更多