【发布时间】:2021-08-23 01:44:48
【问题描述】:
我有一个 Kinesis Firehose 流,其中生成了不同模式的 JSON。 由于这些数据最终应该由其他依赖架构(Glue、Athena)的工具访问,我想通过架构将它们分隔为某些 S3 存储桶中的不同前缀。
我不想为不同的架构使用不同的流。
例如,如果将以下 JSON 发送到流中
{'a': 1, 'b': 2} # JSON 1
{'a': 8, 'b': 5} # JSON 2
{'c': 9} # JSON 3
我希望它们最终存储在 S3 存储桶中,如下所示
/mybucket/YYYY/MM/DD/HH/schema1/json1.json # JSON 1
/mybucket/YYYY/MM/DD/HH/schema1/json2.json # JSON 2
/mybucket/YYYY/MM/DD/HH/schema2/json3.json # JSON 3
我确实事先知道所有可能的模式。
我应该怎么做?
【问题讨论】:
标签: amazon-web-services amazon-kinesis-firehose