【问题标题】:Sqoop: Multi character delimiterSqoop:多字符分隔符
【发布时间】:2018-05-28 23:09:23
【问题描述】:

由于我在 Hive 表中的一个字段包含所有特殊字符,因此我使用 MultiDelimitSerDe(~#) 分隔了配置单元字段。现在需要使用 Sqoop 导出将这些数据导出到 My sql 中。而且我没有看到 Sqoop 使用多个分隔符导出。

还有其他方法吗?这些字段具有数据类型 - date、bigint、decimal(16,2) 和 char(3)。因此不能使用 substr。

【问题讨论】:

    标签: hadoop sqoop


    【解决方案1】:

    由于您的数据中包含所有特殊字符,您可以在表格中使用空格或制表符分隔符,并将 sqoop 导出的分隔符​​称为空格或制表符分隔符。

    arguments --input-fields-terminated-by and --input-lines-terminated-by
    

    制表符分隔符

    --input-fields-terminated-by "\t"
    

    【讨论】:

    • 该选项卡将不起作用,因为它是一个可能包含选项卡的名称字段。
    • 最好使用自定义分隔符,请参阅解释此问题的堆栈链接:stackoverflow.com/questions/38825285/…
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-02-23
    • 2019-08-29
    • 1970-01-01
    • 2011-12-26
    • 1970-01-01
    相关资源
    最近更新 更多