【发布时间】:2017-11-19 05:59:31
【问题描述】:
我们有一个 Cloudera 集群启动并运行一个 h2o 实例,尽管它似乎正在运行 h2o.jar(据我了解,如果不正确,请纠正我)是独立的 h2o。我可以连接,但它不会从我们的 HDFS 加载任何文件。 (所有这些我都可以通过边缘节点上的“ps”看到。
所以我用 h2odriver.jar 启动了一个实例
java -jar /path/to/h2odriver.jar -nodes 2 -mapperXmx 5g -output /my/hdfs/dir
我得到了几个输出/回调地址:
[Possible callback IP address: 10.96.243.46:33728]
[Possible callback IP address: 127.0.0.1]
Using mapper->driver callback IP address and port: 10.96.243.46:33728
所以我启动 python 并尝试连接(如果我使用 10.96.243.46,也会发生同样的事情):
>>>h2o.connection(ip='127.0.0.1', port='33728')
得到
'Connecting to H2O server at http://127.0.0.1:33728..... failed.
H2OConnectionError: COuld not estalich link to the H2O cloud http://127.0.0.1:33728 after 5 retries
...
Failed to establish a new connection:[Errno 111] Connection refused',))`
我可以看到 H2O jar/java 作业在我的屏幕上:
`MapperToDriverMessage: Read invalid type (G) from socket, ignoring...
MapperToDriverMessage: read: Unknown Type `
我不知道如何在集群模式下启动 h2o 并让它访问我们的 hdfs 系统甚至连接。我可以连接到 h2o.jar 版本,但是看不到 hdfs(它可以看到 edgenode 的文件系统)。启动 H2O 以便它可以看到附加的 HDFS 系统的正确方法是什么(我们在企业环境中运行 Cloudera 5.7,Python 是 3.6,H2O 是 3.10.0.6,我知道我们有大量的防火墙/安全性——我相信我们是通过 LDAP 设置的
【问题讨论】: