【发布时间】:2019-10-11 07:10:25
【问题描述】:
我已经定义/设置了一个爬虫来读取和编目 S3 存储桶中的 avro 文件。但是爬虫/分类器无法读取字段的“doc”属性,因此它在目录中创建了一个模式,其中包含字段名称和相应的数据类型,但没有 doc 字段值。我正在探索创建自定义分类器的选项,该分类器将读取和填充字段的 doc 属性及其名称和类型。我浏览了 AWS 官方文档,但没有找到任何有关如何操作的信息/示例。谢谢。
【问题讨论】:
标签: aws-glue aws-glue-data-catalog