【问题标题】:AWS Athena Return Zero Records from Tables Created by GLUE Crawler input csv from S3AWS Athena 从 S3 的 GLUE Crawler 输入 csv 创建的表中返回零记录
【发布时间】:2020-04-05 18:52:12
【问题描述】:

我已经阅读了AWS Athena Returning Zero Records from Tables Created from GLUE Crawler input csv from S3问题下的答案

还有问题https://aws.amazon.com/de/premiumsupport/knowledge-center/athena-empty-results/

按照建议

  1. 我已将 S3 中的文件夹路径而不是文件名提供给 Glue 爬虫。
  2. 我已删除并重新创建了爬虫

但没用

我的情况:

s3 存储中来自 csv 的样本数据:

Cloud Watch Log 显示胶表创建成功:

架构结构如下:

Sizekey 333 匹配 csv 数据大小:

但是当我运行 Athena 查询时,我得到了结果:

只返回列,不返回记录。扫描的数据:0 KB

谁知道为什么胶水爬虫不能转换数据?

谢谢!

【问题讨论】:

    标签: amazon-web-services amazon-s3 aws-glue amazon-athena


    【解决方案1】:

    查看生成的表名后,您似乎在传递给 Glue 爬虫的文件夹路径中有多个具有不同架构的文件。如果您希望在 Athena 中查询这些表,则必须将这些具有不同架构的 CSV 文件放在不同的文件夹中。

    虽然您将文件夹路径传递给 Glue 爬虫,但它会为 Athena 表创建具有完整文件路径的表。您可以通过运行 show create table <table-name> 来验证这一点。

    【讨论】:

    • "将这些具有不同架构的 CSV 文件放在不同的文件夹中" -- 可以!谢谢!
    • 希望有更好的文档记录。谢谢!
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-01-22
    相关资源
    最近更新 更多