【发布时间】:2018-10-06 19:36:01
【问题描述】:
我想使用 Pyspark API 将结构流数据写入 Cassandra。
我的数据流如下:
Nifi -> Kafka -> Spark Structure Streaming -> Cassandra
我尝试过以下方式:
query = df.writeStream\
.format("org.apache.spark.sql.cassandra")\
.option("keyspace", "demo")\
.option("table", "test")\
.start()
但收到以下错误消息: “org.apache.spark.sql.cassandra”不支持流式写入。
我也尝试过另一种方法:[来源 - DSE 6.0 Administrator Guide]
query = df.writeStream\
.cassandraFormat("test", "demo")\
.start()
但出现异常:AttributeError: 'DataStreamWriter' 对象没有属性 'cassandraFormat'
谁能给我一些想法,我该如何进一步进行?
提前致谢。
【问题讨论】:
标签: apache-spark cassandra pyspark datastax spark-structured-streaming