【发布时间】:2015-03-10 06:52:30
【问题描述】:
有一些类似以下格式的数据
url | ip
-----------------------+-----------------
http://aaa.com/ | 1.1.1.1
http://bbb.com/ | 1.2.3.5
http://ccc.com/ | 1.1.1.6
http://ddd.com/ | 1.2.3.4
http://ccc.com/ | 1.1.1.2
http://ccc.com/ | 1.1.1.2
http://ccc.com/ | 1.1.1.2
http://aaa.com/ | 1.1.1.1
http://bbb.com/ | 1.2.3.5
我现在尝试按 url 计算 ip 列,它是每个组中的前 n 个 ip。喜欢
url | ip | ipcount
-----------------------+-----------------+-----------------
http://aaa.com/ | 1.1.1.1 | 2
http://aaa.com/ | 5.6.7.8 | 1
http://bbb.com/ | 1.2.3.5 | 2
http://ccc.com/ | 1.1.1.2 | 3
http://ccc.com/ | 1.1.1.6 | 1
http://ddd.com/ | 1.2.3.4 | 1
请告诉我如何编写 HQL 以在 Hive 中实现这一点?
更新:抱歉,我忘了注意我应该得到每个组中的前 N 条记录,例如 ...
【问题讨论】:
标签: hadoop count hive sql-order-by hql