【发布时间】:2018-10-18 12:45:56
【问题描述】:
我有一个 postgreSQL 数据库的转储文件,大小为 10 GB。
我知道我们可以使用Sqoop 将PostgreSQL 导入HDFS,但是我需要将此文件导入hdfs 或按原样导入hive(转储文件)?
【问题讨论】:
-
更多关于所需转储格式的信息
-
为什么要用
sqoop,可以用hdfs dfs -put <source> <dest-in-hdfs>。 -
你想把它作为一个文件还是一个表格?
-
我想把它作为一个表格。它的格式是 .pgdump。
-
我想在 hive 上有表,因为它们在 postgres 中
标签: python postgresql hive hdfs sqoop