【发布时间】:2018-07-23 13:21:48
【问题描述】:
我有 PySpark 工作 InitiatorSpark.py,代码如下:
from pyspark.sql import SparkSession
spark = SparkSession \
.builder \
.appName("Test") \
.getOrCreate()
lines = (spark
.readStream
.format("org.apache.bahir.sql.streaming.mqtt.MQTTStreamSourceProvider")
.option("topic","my_topic")
.load("tcp://{}".format("127.0.0.1:1883")))
我运行如下:
spark-submit --jars lib/spark-sql-streaming-mqtt_2.11-2.2.1.jar InitiatorSpark.py
Spark 启动,但随后在 .load("tcp://{}".format("127.0.0.1:1883"))) 行失败并显示以下消息:
Caused by: java.lang.ClassNotFoundException: org.eclipse.paho.client.mqttv3.MqttClientPersistence
虽然我提供了正确的 JAR 文件,但似乎找不到类 MqttClientPersistence。在lib里面我有两个文件:
spark-streaming-mqtt_2.11-2.2.1-sources.jar
spark-streaming-mqtt_2.11-2.2.1.jar
我的设置有什么问题?
【问题讨论】:
标签: python apache-spark pyspark mqtt