【发布时间】:2021-07-05 14:53:45
【问题描述】:
我们正在使用 Cloudera CDH 4,并且能够按预期将表从我们的 Oracle 数据库导入我们的 HDFS 仓库。问题是我们的数据库中有成千上万的表,而 sqoop 一次只支持导入一个表。
哪些选项可用于将多个表导入 HDFS 或 Hive?例如,一次将 200 个表从 oracle 导入 HDFS 或 Hive 的最佳方法是什么?
到目前为止,我看到的唯一解决方案是为每个表导入创建一个 sqoop 作业,然后单独运行它们。由于 Hadoop 旨在处理大型数据集,因此似乎应该有更好的方法。
【问题讨论】: