【发布时间】:2015-07-01 16:26:12
【问题描述】:
我正在尝试按照官方文档设置 Spark 独立集群。
我的主人在一个运行 ubuntu 的本地虚拟机上,我也有一个工人在同一台机器上运行。它正在连接,我可以在主服务器的 WebUI 中看到它的状态。
这是 WebUi 图像 -
但是当我尝试从另一台机器连接从机时,我无法做到。
这是我从另一台机器启动时在工作程序中收到的日志消息。
在更新 conf\slaves 和从属服务器 start-slave.sh spark://spark:7077 后,我尝试使用来自主服务器的 start-slaves.sh。
[主主机名 - spark; Worker hostanme - worker]
15/07/01 11:54:16 WARN ReliableDeliverySupervisor: Association with remote system [akka.tcp://sparkMaster@spark:7077] has failed, address is now gated for [5000] ms. Reason is: [Association failed with [akka.tcp://sparkMaster@spark:7077]].
15/07/01 11:54:59 ERROR Worker: All masters are unresponsive! Giving up.
15/07/01 11:54:59 INFO Utils: Shutdown hook called
当我尝试从奴隶远程登录到主人时,这就是我得到的 -
root@worker:~# telnet spark 7077
Trying 10.xx.xx.xx...
Connected to spark.
Escape character is '^]'.
Connection closed by foreign host.
Telnet 似乎可以工作,但连接一建立就关闭。这可能与问题有关吗?
我已经在两台机器的 /etc/hosts 中添加了主从 IP 地址。 我遵循了SPARK + Standalone Cluster: Cannot start worker from another machine 给出的所有解决方案 但它们对我没有用。
我在两台机器的 spark-env.sh 中都设置了以下配置 -
导出 SPARK_MASTER_IP=spark
导出 SPARK_WORKER_PORT=44444
非常感谢任何帮助。
【问题讨论】:
标签: apache-spark