【问题标题】:Can I use spark 2.3.0 and pyspark to do stream processing from Kafka?我可以使用 spark 2.3.0 和 pyspark 从 Kafka 进行流处理吗?
【发布时间】:2018-08-10 14:53:24
【问题描述】:

我打算用 pyspark 做流处理,用 Kafka 作为数据源。

我发现 Spark Python API 不支持 Kafka 0.10 连接器。

我可以在 Spark 2.3.0 中使用 Kafka 0.8 连接器,无论它已被弃用吗?

【问题讨论】:

    标签: apache-spark pyspark apache-kafka


    【解决方案1】:

    已弃用,但未删除。你可以使用它。

    但是,您可能对结构化流感兴趣,它在 Python 中支持 Kafka 0.10 - 链接 here。这是 Spark 中新的 Streaming API,它将取代 DStreams

    【讨论】:

    • 我相信 OP 不喜欢你的回答,因此投了反对票。
    猜你喜欢
    • 1970-01-01
    • 2023-04-03
    • 2019-05-19
    • 2022-06-16
    • 2016-12-20
    • 2020-01-02
    • 2019-10-26
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多