【问题标题】:List of delimiters used in sqoopsqoop 中使用的分隔符列表
【发布时间】:2015-04-02 14:55:49
【问题描述】:

我正在将数据从 oracle 发送到 hive,但问题是数据包含所有分隔符,因此我无法使用键盘上可用的任何分隔符。我也尝试了“/001”,但也不起作用。

【问题讨论】:

  • 我说的是用于分隔字段的分隔符

标签: oracle hive sqoop


【解决方案1】:

我的第一个想法是从 oracle 中假脱机一个 xml 文件。

然后您可以在 hive 中使用自定义 UDF 将该 xml 加载到 hive 像这样: https://cwiki.apache.org/confluence/display/Hive/LanguageManual+XPathUDF

【讨论】:

    【解决方案2】:

    分隔符可以指定为:

    • \b(退格)
    • \n(换行符)
    • \r(回车)
    • \t(制表符)
    • \"(双引号)
    • \'(单引号)
    • \(反斜杠)
    • \0 (NUL)

    有关更多信息,您可以查看以下链接: http://archive-primary.cloudera.com/cdh5/cdh/5/sqoop-1.4.6-cdh5.10.1/SqoopUserGuide.html#_delimited_text_formats_and_field_and_line_delimiter_characters


    【讨论】:

    • 问题是大部分都是数据的一部分。我正在使用 Ctrl+A,因为这是 Hive 从文件中读取数据的默认分隔符。感谢您的帮助!
    猜你喜欢
    • 2018-05-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-02-22
    • 1970-01-01
    • 1970-01-01
    • 2021-12-27
    • 1970-01-01
    相关资源
    最近更新 更多