【问题标题】:Transfer hive query result from one hadoop cluster to another hadoop cluster将 hive 查询结果从一个 hadoop 集群传输到另一个 hadoop 集群
【发布时间】:2019-09-06 05:14:17
【问题描述】:

我有两个集群 A 和 B。集群 A 有 5 个表。现在我需要对这5张表进行hive查询,查询结果应该更新集群B表数据(覆盖结果查询的所有列)

注意:在此过程中,我们不应在集群 A 上创建任何文件,但允许使用临时文件。

这可行吗?两个集群之间需要什么权限/配置才能实现这一点?

我怎样才能得到这个任务/任何其他有效的选择?

完成这项任务后,我应该使用 Oozie 自动化..

【问题讨论】:

    标签: hadoop hive hiveql oozie distcp


    【解决方案1】:

    您是否为每个集群的元数据或配置单元表使用数据库?如果是,那么 - 如果您使用相同的数据库在两个集群中存储配置单元表,那么您可以共享它们。我知道这听起来很直观,但只是提到它以防您没有考虑过。

    【讨论】:

      猜你喜欢
      • 2016-08-10
      • 2018-06-02
      • 2014-06-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-02-25
      • 2019-09-08
      相关资源
      最近更新 更多