【发布时间】:2018-11-08 22:07:15
【问题描述】:
我想使用 Spark 流来读取 JSON 格式的单个 Kafka 主题消息,但并非所有事件都具有相似的架构。如果可能,检查每个事件的架构并进行相应处理的最佳方法是什么?
是否可以在内存中将多个组分组,每个组由一堆相似的模式事件组成,然后将每个组作为一个整体处理?
【问题讨论】:
-
我建议 1) 对主题中的每条消息使用类似的架构 2) Avro 可以比 JSON 更好地帮助您
标签: json apache-spark apache-kafka