【发布时间】:2017-01-19 18:27:42
【问题描述】:
如何使用 SparkSession.SQL 在 Java 中针对 Cassandra 执行 Prepared 和 Batch 语句? 我正在使用 Spark 2.1
【问题讨论】:
标签: java apache-spark cassandra apache-spark-sql
如何使用 SparkSession.SQL 在 Java 中针对 Cassandra 执行 Prepared 和 Batch 语句? 我正在使用 Spark 2.1
【问题讨论】:
标签: java apache-spark cassandra apache-spark-sql
简答:批处理和准备语句自动发生。
长答案:SparkSql 通过 Spark Cassandra 连接器 - Cassandra 数据源工作。数据源关系定义了如何从 Cassandra 读取和写入数据。这意味着通过 SparkSql 或 Dataset api 进行的任何写入都将使用 Spark Cassandra 连接器附带的所有功能。
所有写入都将使用准备好的语句和分区键批处理来完成。要调整批处理的完成方式(或任何其他写入配置),您可以更改此处列出的参数
由于 SparkSql 仅通过这种关系进行通信,因此无法使用 Cassandra 特定的概念,例如 Batching 或 Prepared statements。
【讨论】:
SELECT * from X Where X.a > 5 INSERT INTO Y