【发布时间】:2018-07-01 23:05:54
【问题描述】:
我将 Apache Spark 2.2.1 与 Cassandra 3.11 和来自 python/pyspark 的 Datastax spark-cassandra-connector 一起使用。
我想从数据集结构创建 Cassandra 表。所以,我在 Java 的 DataSetFunction 包中找到了一个函数createCassandraTable,但是我找不到与 pyspark 包的对应关系。 This 是 Java 中的类似问题。
我正在尝试这样的事情:
dataset.createCassandraTable('examples', 'table_example', partitionKeyColumns = ['id'])
但createCassandraTable 不是数据集/数据框的方法。
我知道我可以在 spark 中使用原始 CQL 创建表,但是我想以动态和编程方式这样做。虽然,它是另一种选择,可能是 spark 和 cassandra 类型之间的映射。
这里有什么经验或新想法吗? Spark SQL 替代方案?
【问题讨论】:
标签: apache-spark cassandra pyspark cassandra-3.0 spark-cassandra-connector