【发布时间】:2018-08-10 14:53:24
【问题描述】:
我打算用 pyspark 做流处理,用 Kafka 作为数据源。
我发现 Spark Python API 不支持 Kafka 0.10 连接器。
我可以在 Spark 2.3.0 中使用 Kafka 0.8 连接器,无论它已被弃用吗?
【问题讨论】:
标签: apache-spark pyspark apache-kafka
我打算用 pyspark 做流处理,用 Kafka 作为数据源。
我发现 Spark Python API 不支持 Kafka 0.10 连接器。
我可以在 Spark 2.3.0 中使用 Kafka 0.8 连接器,无论它已被弃用吗?
【问题讨论】:
标签: apache-spark pyspark apache-kafka
已弃用,但未删除。你可以使用它。
但是,您可能对结构化流感兴趣,它在 Python 中支持 Kafka 0.10 - 链接 here。这是 Spark 中新的 Streaming API,它将取代 DStreams
【讨论】: