【发布时间】:2017-11-02 03:44:13
【问题描述】:
目前,我们有一个运行 3 个 Spark 节点的项目。我们想要扩展 Spark 工作者。但是,让每个 spark 节点在 Cassandra 节点之上运行在 CPU/内存使用方面非常昂贵。我的问题是,是否可以在没有 Cassandra 的情况下使用 DataStax 部署 Spark 工作人员?
【问题讨论】:
标签: apache-spark cassandra datastax
目前,我们有一个运行 3 个 Spark 节点的项目。我们想要扩展 Spark 工作者。但是,让每个 spark 节点在 Cassandra 节点之上运行在 CPU/内存使用方面非常昂贵。我的问题是,是否可以在没有 Cassandra 的情况下使用 DataStax 部署 Spark 工作人员?
【问题讨论】:
标签: apache-spark cassandra datastax
您通常会在每个 Cassandra 节点上部署一个 Spark-worker 以支持数据本地性(如果可能,spark-worker 将优先访问它的本地节点)。 但是,如果您真的想将 spark 服务与 cassandra 服务分离,您有几个选择:
祝你好运!
【讨论】: