【问题标题】:Eclipse on windows and Hadoop on remote clusterWindows 上的 Eclipse 和远程集群上的 Hadoop
【发布时间】:2026-02-05 13:15:01
【问题描述】:

谁能解释一下如何在远程机器上为 Hadoop 设置开发环境。 网上的大部分教程似乎都集中在本地模式或伪分布式模式,这涉及在本地或通过 cygwin 安装 hadoop。我想避免这种情况。理想情况下,我想通过 Eclipse 将代码推送到远程集群,而不需要在本地机器上安装 hadoop。

我已经有一个集群,可以通过Eclipse-Hadoop Plugin访问文件系统,但是如何向远程集群提交作业呢?我应该更改 eclipse 插件中的哪些参数? (我正确设置了名称节点、作业跟踪器位置,但高级配置显示了数据节点目录、数据节点位置和许多其他设置)。

谢谢

【问题讨论】:

    标签: windows eclipse hadoop remote-access


    【解决方案1】:

    如果原因是远离Cygwin并使用原生工具,我的解决方案是通过ambari创建一个安装了HDP2.2桌面版centos6.6的虚拟机作为单节点实例和所有原生开发工具在桌面上。一旦我的代码被开发出来,我就有了一个将我的代码推送到集群的部署脚本,该集群在 CLI 中执行。连接通常通过 NAT 或类似方式得到保证,因此可以在相对不受限制的全屏模式下在工作计算机上使用。

    拥有原生 centos 虚拟机意味着我编写的所有代码都是在与集群完全相同的操作系统和 HDP 版本上开发的。这也意味着我在使用 CLI 时不必处理服务器延迟(这让我感到麻木)。

    【讨论】:

      最近更新 更多