【发布时间】:2018-09-06 03:18:53
【问题描述】:
要求是跟上目标 ORC 表的架构演变。我正在从源接收 JSON 事件。我们计划将这些转换为 AVRO(因为它支持模式演变)。由于架构可以每天/每周更改,我们需要不断摄取新的数据 JSON 文件,将它们转换为 AVRO 并将所有数据(旧/新)存储在 ORC 配置单元表中。我们如何解决这个问题?
【问题讨论】:
-
源可以只发送 Avro 吗?如果没有,您能否将事件摄取到 NiFi 或 Kafka 中,例如,然后从中生成 Avro?
-
欢迎来到 StackOverflow。请按照您创建此帐户时的建议阅读并遵循帮助文档中的发布指南。 Minimal, Complete, Verifiable Example 适用于此。在您发布 MCVE 代码并准确描述问题之前,我们无法有效地帮助您。