【发布时间】:2021-04-03 16:37:28
【问题描述】:
尝试为 kafka 启动 readStream 时出现以下错误,我的 Kafka 已启动并正在运行,我对其进行了多次测试以确保它正在处理。 Kafka 主题也已创建。
'''
kafka_df = spark.readStream \
.format("kafka") \
.option("kafka.bootstrap.servers", "localhost:9092") \
.option("subscribe", "mytopic") \
.option("startingOffsets", "earliest") \
.load()
'''
Traceback(最近一次调用最后一次):
文件“C:/Users//PycharmProjects/SparkStreaming/PySparkKafkaStreaming.py”,第 18 行,在
kafka_df = spark.readStream
文件“C:\Users
【问题讨论】:
-
您需要运行或打包并构建 KAFKA 的依赖项
标签: python pyspark apache-kafka apache-kafka-streams spark-structured-streaming