【发布时间】:2021-08-17 23:23:31
【问题描述】:
我正在尝试构建一个对回归问题进行预测的烧瓶服务。我有构建具有大约 20 列的模型所需的数据。使用这些数据,我建立了一个很好的回归模型。但是在数据上训练模型,我已经做了很多特征工程,例如 log box cox 转换、one-hot 编码、由于高多重共线性而丢弃少量列等,现在特征数量为 35。我在这 35 个特征上训练了模型,检查了性能并使用 pickle 保存了模型。我在烧瓶服务中加载了我的腌制模型。但是现在模型的输入是我的原始数据的格式,它只有 20 列。
那么,如何对新的输入集进行所有特征工程?我只能保存经过训练的模型,但是在传递我的新数据进行预测之前,我如何进行所有的特征工程。
【问题讨论】:
标签: python machine-learning flask deployment pickle