【发布时间】:2014-09-25 00:41:15
【问题描述】:
如果 shell 连接到集群或仅在本地模式下运行,是否可以从 Spark shell 中验证哪些节点?我希望用它来调查以下问题:
我使用 DSE 设置了一个小型 3 节点 Cassandra Analytics 集群。我可以登录到 3 个服务器中的任何一个并运行 dse spark 并启动 Spark shell。我还验证了所有 3 台服务器都通过运行 dsetool sparkmaster 配置了 Spark 主服务器。
但是,当我使用 Spark shell 运行任何任务时,它似乎只在本地运行。我运行了一个小测试命令:
val rdd = sc.cassandraTable("test", "test_table")
rdd.count
当我查看 Spark Master 网页时,我发现只有一台服务器正在运行该作业。
我怀疑当我运行dse spark 时,它是在本地模式下运行shell。我查看了如何为 Spark 0.9.1 shell 指定一个主控,即使我使用MASTER=<sparkmaster> dse spark(来自Programming Guide)它仍然只能在本地模式下运行。
【问题讨论】:
标签: apache-spark datastax-enterprise