【发布时间】:2019-04-26 21:33:21
【问题描述】:
当我想使用 sqoop 将数据导入 hive 时,我可以指定 --hive-home <dir>,并且 sqoop 将调用安装在执行脚本的机器上的指定 hive 副本。但是hbase呢? sqoop 是如何知道我希望在哪个 hbase 实例/数据库上导入数据的?
【问题讨论】:
当我想使用 sqoop 将数据导入 hive 时,我可以指定 --hive-home <dir>,并且 sqoop 将调用安装在执行脚本的机器上的指定 hive 副本。但是hbase呢? sqoop 是如何知道我希望在哪个 hbase 实例/数据库上导入数据的?
【问题讨论】:
Maybe the documentation helps?
通过指定
--hbase-table,您指示 Sqoop 导入到 HBase 中的表而不是 HDFS 中的目录
我看到的每个示例都只显示了该选项以及列族等等,所以我认为它取决于可能属于sqoop-env.sh 的任何变量,例如Hortonworks docs say 的内容
当您提供 hive 主目录时,这也不是告诉它任何数据库或表信息,而是告诉它在您运行 Sqoop 的机器上存在 Hive 配置文件的位置。默认设置为环境变量$HIVE_HOME
【讨论】: