【发布时间】:2017-12-17 18:04:42
【问题描述】:
在我的公司,我们有一个基于 Hadoop 的 ETL 解决方案。这些是我们的数据流中调用的一些步骤:
- 从 SQL Server 导出数据
- 导入 Hive
- 应用转换等
- 将处理后的数据存储到 Solr 中
我们的目标是能够从 Spoon 管理整个 ETL 流程。为了实现这一点,我一直在尝试使用 carte 服务器来远程执行勺子作业。问题是目前我在 Spoon 的 View 面板下没有看到任何“Slave server”选项。我正在使用社区版和 7.1 版。这是 EE 的一个特性还是我缺少一些配置?
提前致谢
【问题讨论】:
-
为什么要看到“从服务器”选项? “从服务器”是指集群中的数据节点吗?
标签: hadoop pentaho kettle pentaho-data-integration