【发布时间】:2018-05-28 23:09:23
【问题描述】:
由于我在 Hive 表中的一个字段包含所有特殊字符,因此我使用 MultiDelimitSerDe(~#) 分隔了配置单元字段。现在需要使用 Sqoop 导出将这些数据导出到 My sql 中。而且我没有看到 Sqoop 使用多个分隔符导出。
还有其他方法吗?这些字段具有数据类型 - date、bigint、decimal(16,2) 和 char(3)。因此不能使用 substr。
【问题讨论】:
由于我在 Hive 表中的一个字段包含所有特殊字符,因此我使用 MultiDelimitSerDe(~#) 分隔了配置单元字段。现在需要使用 Sqoop 导出将这些数据导出到 My sql 中。而且我没有看到 Sqoop 使用多个分隔符导出。
还有其他方法吗?这些字段具有数据类型 - date、bigint、decimal(16,2) 和 char(3)。因此不能使用 substr。
【问题讨论】:
由于您的数据中包含所有特殊字符,您可以在表格中使用空格或制表符分隔符,并将 sqoop 导出的分隔符称为空格或制表符分隔符。
arguments --input-fields-terminated-by and --input-lines-terminated-by
制表符分隔符
--input-fields-terminated-by "\t"
【讨论】: