【发布时间】:2020-08-04 04:59:26
【问题描述】:
我们有一个 ETL 脚本,它读取数据表单目录并在 s3 中作为 parquet 写入。我们还调用爬虫来创建/更新 Athena 中的表。但是,它正在创建表,但在表名中添加了一些奇怪的后缀。
我正在抓取的文件夹中的所有文件都采用相同架构的镶木地板。此外,仅当我们从 ETL 脚本调用爬虫时才会发生这种情况。
我们用来调用爬虫的脚本
glue_client = boto3.client("glue", region_name=args.get("aws_region"))
glue_client.start_crawler(Name=args["crawler_name"])
预期:table_name 实际:table_name_31e198c8c61861f127ae06487eb14a3f
【问题讨论】:
标签: amazon-web-services boto3 aws-glue