【发布时间】:2020-08-02 23:38:24
【问题描述】:
在写入 Cassandra 表时,我得到以下有关写入行数和所用时间的信息。从日志中,我可以看到它来自 TableWriter 类。如何在不调用 RDD 操作的情况下从 Cassandra 读取时找到相同的信息?我不确定使用哪种方法来阅读。
2020-04-20 11:58:42 INFO com.datastax.spark.connector.writer.TableWriter.logInfo:35 - Wrote 24 rows to my_keyspace.mytable in 0.153 s.
将 spark 数据帧写入 Cassandra 表的代码
myDF.write
.format("org.apache.spark.sql.cassandra")
.mode(saveMode)
.options(Map("keyspace" -> "my_keyspace", "table" -> "my_table"))
.save()
将 Cassandra 表读入 spark RDD 的代码
val cassandraRDD = sparkSession.read
.format("org.apache.spark.sql.cassandra")
.options(Map( "table" -> "my_table", "keyspace" -> "my_keyspace", "pushdown" -> "true"))
.load()
【问题讨论】:
标签: scala apache-spark cassandra datastax