【问题标题】:Unable to see any columns in table after running AWS Glue crawler运行 AWS Glue 爬虫后看不到表中的任何列
【发布时间】:2020-07-14 07:21:05
【问题描述】:

我对 AWS Glue 比较陌生,但是在创建爬虫并成功运行后,我可以看到已经创建了一个新表,但我看不到该表中的任何列。完全是空白。

我使用来自 S3 存储桶的 .csv 文件作为我的数据源。

【问题讨论】:

  • 你能在这里发布一些示例记录吗?

标签: database amazon-web-services aws-glue


【解决方案1】:
  1. 您的文件是 UTF8 编码的吗...如果不是,胶水就有问题。
  2. 您的文件是否至少有 2 条记录
  3. 文件是否包含多列。

有多种因素会影响爬虫识别 csv 文件

请参阅有关内置分类器以及正确抓取 csv 文件需要什么的文档

https://docs.aws.amazon.com/glue/latest/dg/add-classifier.html

【讨论】:

    猜你喜欢
    • 2018-05-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-04-03
    • 1970-01-01
    相关资源
    最近更新 更多