【问题标题】:Spark - Structured Streaming Kafka (dynamic deserialize)Spark - 结构化流式 Kafka(动态反序列化)
【发布时间】:2020-03-29 14:12:29
【问题描述】:

假设我们在流中订阅了2个topic,一个topic是avro的,一个topic是string的,是否可以根据topic名动态反序列化?

【问题讨论】:

    标签: apache-spark apache-kafka spark-structured-streaming


    【解决方案1】:

    理论上是的

    Deserializer 接口接受主题名称作为参数,您可以对其进行检查。

    但是,在 Spark 中访问它需要您自己的 UDF 包装器。


    最终,我认为最好为每个不同格式的主题定义两个流数据帧,或者简单地生成 Avro 编码的字符串。

    【讨论】:

      猜你喜欢
      • 2021-09-30
      • 2017-08-23
      • 2018-07-20
      • 2018-03-31
      • 2019-11-25
      • 1970-01-01
      • 2019-04-30
      • 2020-01-31
      • 1970-01-01
      相关资源
      最近更新 更多