【发布时间】:2019-05-07 00:57:10
【问题描述】:
总结:关注点与 Hive 中的 UDF 创建有关。
亲爱的朋友们,由于我是在 Hive 中创建 UDF 的新手(我已通过 google 阅读过有关此内容,但不是很清楚),我在这里的第一件事是确定哪种方式可能是最好的方式,例如 Java/Python 或任何其他人编写配置单元 UDF。
另一件事是我应该根据什么来分析?我应该寻找哪些参数?
请注意,我几乎没有下面给出的需要编写 UDF 的函数。 1.在需要“不聚合”的情况下,选择另一个功能所需的子句分组。 2.返回需要“聚合”时需要的select和group by子句。 3.对于vector_indexes是SUM,LISTAGG字符串用于数据采集查询 4.返回其他函数使用的WHERE子句。 5 以逗号分隔的字符串返回第 n 项。 6. 窄数据的百分位值函数。 7. 计算给定计数器名称的百分位数。除了百分位数,它还输出计算中使用的样本数、峰值和平均值。
非常感谢您,
【问题讨论】:
标签: java python hive user-defined-functions