【问题标题】:AWS Glue change schema from json fileAWS Glue 从 json 文件更改架构
【发布时间】:2021-05-26 02:07:22
【问题描述】:

我想根据 JSON 文件更改 AWS Glue 表架构。 JSON 格式为{"column_name0":"data_type0","column_name1":"data_type1"}。 我怎样才能做到这一点?我读过可以使用JSON classifier,但我不知道如何使用。我尝试将我的 JSON 文件添加到 S3 文件夹中,其中存储了爬虫创建表的文件,但它从 JSON 文件创建了另一个表。

【问题讨论】:

    标签: amazon-web-services amazon-s3 aws-glue


    【解决方案1】:

    这样做似乎是一个奇怪的选择,您是否考虑过需要手动创建架构的特定场景?直接在源上使用带有from_catalogfrom_options 的爬虫通常会很好地推断架构。如果您想保留有限的列,只需从框架中选择这些列并丢弃其余列。如果您有转换(例如转换)数据类型的特定需求,请使用ResolveChoice

    话虽如此,您有几个选择:

    注意:我不希望 JSON 分类器在这里对您有用。您可以使用custom classifier,但这只会让您指定您想要使用的列(通过 JSONPath),并且类型会被推断出来。每次您还想更改架构时,都需要编辑该自定义分类器。

    【讨论】:

    • 其实我认为这是最简单的方法。显然不是!在我的情况下,推断模式不好,但我有 200 多列,因此直接在表中从编辑模式更改它们是不可行的。我会尝试使用爬虫选项
    猜你喜欢
    • 2022-08-20
    • 2022-01-23
    • 2018-07-20
    • 2021-10-12
    • 2020-10-01
    • 2022-08-02
    • 2018-09-02
    • 2018-04-06
    • 2021-11-14
    相关资源
    最近更新 更多