【问题标题】:split function does not work in Cloudera Impala拆分功能在 Cloudera Impala 中不起作用
【发布时间】:2013-05-10 17:17:11
【问题描述】:

当我尝试在 Cloudera Impala 中使用拆分功能时,我不断收到一个显示“拆分未知”的 AnalysisException。它似乎是内置功能页面上列出的有效功能。作为参考,我正在使用 Hue 与 Impala 进行交互。有谁知道这个问题的原因吗?

【问题讨论】:

  • 你能把失败的功能和确切的错误放在一起吗?这些会很有帮助:)
  • 例如这样的查询:select count(*) from tab1 where length(split(",", col1)) > 0;给出错误 AnalysisException: split unknown。显然这是文档中的一个错误,因为 github.com/cloudera/impala/blob/master/common/function-registry/… 中没有列出拆分功能
  • 它看起来确实是一个错误。错误肯定是“没有找到这个方法”,所以“split”一定没有。
  • 我在谷歌群里问了同样的问题,得到了官方回复。基本上不支持 split(),因为它会返回一个数组并且 Impala 还不支持复杂类型...
  • 太好了,你应该回答你自己的问题:)

标签: hadoop hive cloudera impala


【解决方案1】:

我在谷歌群里问了同样的问题,得到了官方回复。基本上,这是文档中的印刷错误。不支持 split(),因为它会返回一个数组,而且 Impala 还不支持复杂类型。

【讨论】:

    【解决方案2】:

    cdh 5.5 刚刚为 impala 提供了拆分和复杂类型支持。

    【讨论】:

      【解决方案3】:

      Impala 中的以下工作:

      split_part(string source, string delimiter, bigint n)
      

      文档在这里: https://www.cloudera.com/documentation/enterprise/5-9-x/topics/impala_string_functions.html

      【讨论】:

      • 嗯,虽然我很感谢您的意见,但这根本不能回答问题 + split_part 只返回拆分的 nth 元素。
      猜你喜欢
      • 2014-03-05
      • 1970-01-01
      • 2017-09-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-09-24
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多