【问题标题】:feature engineering while making predictions using a trained ML model as a service特征工程,同时使用经过训练的 ML 模型作为服务进行预测
【发布时间】:2021-08-17 23:23:31
【问题描述】:

我正在尝试构建一个对回归问题进行预测的烧瓶服务。我有构建具有大约 20 列的模型所需的数据。使用这些数据,我建立了一个很好的回归模型。但是在数据上训练模型,我已经做了很多特征工程,例如 log box cox 转换、one-hot 编码、由于高多重共线性而丢弃少量列等,现在特征数量为 35。我在这 35 个特征上训练了模型,检查了性能并使用 pickle 保存了模型。我在烧瓶服务中加载了我的腌制模型。但是现在模型的输入是我的原始数据的格式,它只有 20 列。

那么,如何对新的输入集进行所有特征工程?我只能保存经过训练的模型,但是在传递我的新数据进行预测之前,我如何进行所有的特征工程。

【问题讨论】:

    标签: python machine-learning flask deployment pickle


    【解决方案1】:

    特征工程工作一旦成功(经过多次实验),就应该转化为输入处理代码(机器学习管道的一部分)。这段代码,也许经过一些重构,应该在输入到训练模型之前作为输入处理代码结束。

    这通常由可插拔架构支持(如 TensorFlow 中的 Pipeline in sklearntf.data 类集)。

    【讨论】:

      猜你喜欢
      • 2019-11-11
      • 2020-07-04
      • 1970-01-01
      • 2018-02-26
      • 1970-01-01
      • 2022-08-19
      • 1970-01-01
      • 2017-03-13
      • 1970-01-01
      相关资源
      最近更新 更多