【发布时间】:2016-03-16 11:29:12
【问题描述】:
我正在寻找一种从 Hive 集合中选择最新项目(日期)的方法。例如有下表t1:
item date
a 2016-01-01
a 2016-02-04
b 2016-01-10
之后
hive> select item, collect_set(date) as dates from t1 group by item;
我有
item dates
a [2016-01-01, 2016-02-04]
b [2016-01-10]
所以现在我需要摆脱过时的日期,即创建表格
item date
a 2016-02-04
b 2016-01-10
谁能帮忙?
【问题讨论】: