【问题标题】:Hive: select the most recent item from the setHive:从集合中选择最近的项目
【发布时间】:2016-03-16 11:29:12
【问题描述】:

我正在寻找一种从 Hive 集合中选择最新项目(日期)的方法。例如有下表t1:

item       date
a          2016-01-01
a          2016-02-04
b          2016-01-10

之后

hive> select item, collect_set(date) as dates from t1 group by item;

我有

item       dates
a          [2016-01-01, 2016-02-04]
b          [2016-01-10]

所以现在我需要摆脱过时的日期,即创建表格

item       date
a          2016-02-04
b          2016-01-10

谁能帮忙?

【问题讨论】:

    标签: hadoop hive hiveql


    【解决方案1】:

    只需使用max():

    select item, max(date) as date
    from t1
    group by item;
    

    如果你真的想要一个新表,你可以使用create table as

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-10-14
      • 2011-01-26
      • 2010-10-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-03-19
      相关资源
      最近更新 更多