【发布时间】:2016-03-17 06:14:32
【问题描述】:
我们使用 python spark cassandra 驱动程序 V3.0.0。来自数据税 当尝试使用数据框加载数据时,where 子句不起作用。 但是,CQL 本身在 Datastax DevCenter 中确实有效。代码是这样的
dataf = sqlc.read.format("org.apache.spark.sql.cassandra")\
.options(table="tran_history", keyspace="test")\
.load()\
.where("usr_id='abc' log_ts >= maxtimeuuid('2016-02-01 10:09:26-0800')")\
.collect()
似乎驱动程序无法识别方法 maxtimeuuid
--------------------下面是错误
File "C:\Spark\spark-1.4.1-bin-hadoop2.6.2\python\lib\pyspark.zip\pyspark\sql\dataframe.py", line 759, in filter
File "C:\Spark\spark-1.4.1-bin-hadoop2.6.2\python\lib\py4j-0.8.2.1-src.zip\py4j\java_gateway.py", line 538, in __call__
File "C:\Spark\spark-1.4.1-bin-hadoop2.6.2\python\lib\py4j-0.8.2.1-src.zip\py4j\protocol.py", line 300, in get_return_value
py4j.protocol.Py4JJavaError: An error occurred while calling o41.filter.
: java.util.NoSuchElementException: key not found: maxtimeuuid
不确定是否存在任何版本匹配问题。我们正在使用 DSE 4.8.1。
【问题讨论】: