【发布时间】:2022-02-09 23:31:12
【问题描述】:
我可以训练顶点 AI AutoML 预测模型,但是当我进行批量预测时出现以下错误
批量预测作业batch_prediction遇到以下情况 错误:
Column "sales" expects type: NUMBER, the actual type is: STRING.
下面是我在大查询中为批量预测传递的测试集样本。
根据批量预测的文档,我们必须发送一些训练/历史数据和预测日期。我就是这么做的。
【问题讨论】:
-
Google 建议您使用相同的输入格式进行训练和预测。您使用输入格式训练模型的接缝,此处列销售额是数字类型,现在在预测中,因为所有字段都是
null自动模式识别(在您导入数据时使用)已将其设置为字符串类型。删除此表并再次导入数据,手动定义架构,并将销售额设置为数字字段。 -
否 @ewertonvsilva,对于 btach 预测,我们必须在一个数据集中提供历史和未来日期。所以有些销售值是数字,有些是空字符串。我指的是这个文档:cloud.google.com/vertex-ai/docs/predictions/…
-
@ewertonvsilva,我刚刚更新了数据的照片,你可以看看我的 btach 预测数据是什么样子的。如果非常感谢任何帮助。
-
能否请检查表输入表的架构?在 BQ 中建表后检查 sales 列的数据类型。如果可能,添加它的打印。
-
我认为你是对的。我尝试直接从 Google Cloud Storage 在 VertexAI 中创建数据集。模型像往常一样训练,但现在评估集(来自模型)将销售列作为字符串。所以可能是因为数据集是 GCS 导入的,所以选择的数据类型是字符串,而 batch_prediction 中的销售额将始终是字符串。所以这一次 batch_prediction 确实有效,因为训练和测试中的模式是一致的。
标签: google-cloud-platform google-cloud-ml google-cloud-automl google-cloud-vertex-ai