【发布时间】:2018-08-07 06:46:24
【问题描述】:
我是 AWS Glue 的新手,我正在努力解决一个问题。我们最近更改了数据库中的一个字段名称,现在我不知道如何在 Glue 中创建映射以同时支持旧字段名称和新字段名称。
旧版映射类似于:
applymapping1 = ApplyMapping.apply(frame = datasource0, mappings = [...("json_property.Foo Bar", "string", "foo_bar", "string")], transformation_ctx = "applymapping1")
我们规范化了 json 属性名称,json_property['Foo Bar'] 变成了json_property.foo_bar。我试过这样做:
applymapping1 = ApplyMapping.apply(frame = datasource0, mappings = [...("json_property.Foo Bar", "string", "foo_bar", "string"), ("json_property.foo_bar", "string", "foo_bar", "string")], transformation_ctx = "applymapping1")
基本上我尝试将两个源字段映射到同一个目标字段。正如预期的那样,这在尝试运行作业时导致了错误...
有什么方法可以让进程从源获取json_property.foo_bar 或json_property['Foo Bar'](以存在者为准)并映射到foo_bar 目标字段?
【问题讨论】: