【问题标题】:How to connect another machine to standalone h2o installation to create a cluster?如何将另一台机器连接到独立的 h2o 安装以创建集群?
【发布时间】:2023-03-25 20:14:01
【问题描述】:

我想在家里用我的商用电脑试用 H2O。如何将它们加入集群?

我需要先创建一个 Hadoop 集群吗?

我在哪里可以找到对我有帮助的文档?

【问题讨论】:

    标签: h2o


    【解决方案1】:

    不,不需要 Hadoop 集群。这是文档for starting nodes from the commandline。 (我也发现读取EC2设置文档有用,然后浏览他们提供的EC2脚本。)

    基本上您需要创建一个 flatfile em>,它是一个简单的文本文件列表IP地址和群集中每个节点的端口。您可以给群集一个名称,我喜欢用相同名称命名扁平文件,这将是“LANTST.TXT”。

    然后,您需要在每台计算机上获取H2O.jar,并将您的Flatfile放在同一个目录中(再次在每台计算机上)。然后用:启动它
    java -Xmx2G -ea -jar h2o.jar -name lantest -ip 192.168.x.y -port 54321 -flatfile lantest.txt
    

    保持该控制台窗口打开,因为日志消息将写入其中。

    通常为每台机器更改.x.y @ 987654323,但其他一切都保持不变。 -Xmx2G 说我给每台机器 2GB;您可能想要调整(但它对每个节点必须完全相同。)

    必须完全相同的其他东西是H2O.jar的版本:次要版本差异并不足够好,因为它检查MD5校验和!

    您可能会遇到的另一件事是防火墙。每个节点必须能够在端口54321和54322上看到彼此节点。因此,在每台机器上打开防火墙上的那些端口。 (在 Windows 上,我还必须打开对 Java 的访问权限。)

    【讨论】:

    • 太棒了!是否存在在机器上运行多个H20实例的添加益处? span>
    • 这也在我的问题清单上!我怀疑如果您有一个4GB机床和16GB机器,则可以在大机器上运行4x4GB实例以具有5节点集群,但您可以更好地运行16GB机器上的单个实例,而不是使用群集(由于通信开销)。但是如果您有10个4GB机器和两个16GB机器中的两个,则设置18节点72GB集群可能比12节点48GB群集更好,或者是2节点32GB集群。如果你尝试任何异国情调的组合,我有兴趣听到结果。 span>
    猜你喜欢
    • 1970-01-01
    • 2019-01-05
    • 2018-11-23
    • 2020-07-16
    • 1970-01-01
    • 2016-06-23
    • 2014-11-05
    • 1970-01-01
    • 2018-02-02
    相关资源
    最近更新 更多