【发布时间】:2019-12-08 22:13:34
【问题描述】:
我已尝试在本地计算机上使用单节点集群和 3 节点集群使用 spark 从 cassandra 获取 250 万个条目,但在这两种情况下,仅 SELECT COUNT(*) from table 就需要 30 秒。我需要这个和类似的其他计数来进行实时分析。
SparkSession.builder().getOrCreate().sql("SELECT COUNT(*) FROM data").show()
【问题讨论】:
标签: scala apache-spark cassandra