【发布时间】:2019-09-06 05:14:17
【问题描述】:
我有两个集群 A 和 B。集群 A 有 5 个表。现在我需要对这5张表进行hive查询,查询结果应该更新集群B表数据(覆盖结果查询的所有列)
注意:在此过程中,我们不应在集群 A 上创建任何文件,但允许使用临时文件。
这可行吗?两个集群之间需要什么权限/配置才能实现这一点?
我怎样才能得到这个任务/任何其他有效的选择?
完成这项任务后,我应该使用 Oozie 自动化..
【问题讨论】:
标签: hadoop hive hiveql oozie distcp