【问题标题】:Vertex AI forecasting AutoML datatype mismatchVertex AI 预测 AutoML 数据类型不匹配
【发布时间】:2022-02-09 23:31:12
【问题描述】:

我可以训练顶点 AI AutoML 预测模型,但是当我进行批量预测时出现以下错误

批量预测作业batch_prediction遇到以下情况 错误:

Column "sales" expects type: NUMBER, the actual type is: STRING.

下面是我在大查询中为批量预测传递的测试集样本。

根据批量预测的文档,我们必须发送一些训练/历史数据和预测日期。我就是这么做的。

【问题讨论】:

  • Google 建议您使用相同的输入格式进行训练和预测。您使用输入格式训练模型的接缝,此处列销售额是数字类型,现在在预测中,因为所有字段都是 null 自动模式识别(在您导入数据时使用)已将其设置为字符串类型。删除此表并再次导入数据,手动定义架构,并将销售额设置为数字字段。
  • 否 @ewertonvsilva,对于 btach 预测,我们必须在一个数据集中提供历史和未来日期。所以有些销售值是数字,有些是空字符串。我指的是这个文档:cloud.google.com/vertex-ai/docs/predictions/…
  • @ewertonvsilva,我刚刚更新了数据的照片,你可以看看我的 btach 预测数据是什么样子的。如果非常感谢任何帮助。
  • 能否请检查表输入表的架构?在 BQ 中建表后检查 sales 列的数据类型。如果可能,添加它的打印。
  • 我认为你是对的。我尝试直接从 Google Cloud Storage 在 VertexAI 中创建数据集。模型像往常一样训练,但现在评估集(来自模型)将销售列作为字符串。所以可能是因为数据集是 GCS 导入的,所以选择的数据类型是字符串,而 batch_prediction 中的销售额将始终是字符串。所以这一次 batch_prediction 确实有效,因为训练和测试中的模式是一致的。

标签: google-cloud-platform google-cloud-ml google-cloud-automl google-cloud-vertex-ai


【解决方案1】:

Google 建议您对根深蒂固和预测使用相同的输入格式。您使用输入格式训练模型的接缝在这里,列 sales 是 numeric 类型,现在在预测中,您使用带有 sales 列的 BigQuery 表作为 string

删除此表并再次手动定义架构导入数据,并将sales设置为数字字段,如下所示:

date:DATE,
store_product_id:STRING,
sales:NUMERIC

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-11-19
    • 2021-11-20
    • 2022-10-20
    • 2021-12-09
    • 2021-09-10
    • 2022-08-18
    • 2021-09-17
    相关资源
    最近更新 更多