【问题标题】:Find most recent occurrence of an event for an individual查找个人最近发生的事件
【发布时间】:2020-06-25 00:16:50
【问题描述】:

对于另一个关于在数组中查找最近日期的问题,我深表歉意。

很遗憾,我没有找到任何其他满足我特殊需求的帖子。

  • 第 1 列是用户 ID
  • 第 2 列是发生的操作类型,并且
  • 第 3 列是操作发生的日期时间戳

我的目标是按 user_id 分组,并将不同操作类型的最新列作为自己的列。

示例数据:

+---------+--------+------------+
| user_id | source |  created   |
+---------+--------+------------+
|       1 | QT     | 2020-01-01 |
|       2 | QT     | 2020-01-02 |
|       3 | QT     | 2020-01-01 |
|       1 | QT     | 2020-01-03 |
|       2 | QT     | 2020-01-04 |
|       3 | QT     | 2020-01-05 |
|       1 | AT     | 2020-01-02 |
|       2 | AT     | 2020-01-02 |
|       3 | AT     | 2020-01-03 |
+---------+--------+------------+

期望的结果:

+---------+------------+------------+
| user_id |   max QT   |   Max AT   |
+---------+------------+------------+
|       1 | 2020-01-03 | 2020-01-02 |
|       2 | 2020-01-04 | 2020-01-02 |
|       3 | 2020-01-05 | 2020-01-03 |
+---------+------------+------------+

我最初的想法是:

```select
user_id
,case when source = 'QT' THEN max(created) END as "last_QT"
,case when source = 'AT' THEN max(created) END as "last_AT"
from analytics.all_tx_bars_all 
group by user_id```

但这给了我错误: 无效操作:列“source”必须出现在 GROUP BY 子句中或在聚合函数中使用

当我将“来源”包含在分组中并选择如下时:

```select
user_id
,source
,case when source = 'QT' THEN max(created) END as "last_QT"
,case when source = 'AT' THEN max(created) END as "last_AT"
from analytics.all_tx_bars_all 
group by user_id,source```

我得到类似的东西:

+---------+--------+------------+------------+
| user_id | source |   max QT   |   Max AT   |
+---------+--------+------------+------------+
|       1 | QT     | 2020-01-03 |            |
|       2 | QT     | 2020-01-04 |            |
|       3 | QT     | 2020-01-05 |            |
|       1 | AT     |            | 2020-01-02 |
|       2 | AT     |            | 2020-01-02 |
|       3 | AT     |            | 2020-01-03 |
+---------+--------+------------+------------+

为了给我的问题增添一点色彩,我在这里使用元数据库中的 SQL 工具

【问题讨论】:

    标签: sql date pivot amazon-redshift


    【解决方案1】:

    你只需要聚合:

    select user_id,
           max(case when source = 'QT' then created end) as last_QT,
           max(case when source = 'AT' then created end) as last_AT
    from analytics.all_tx_bars_all 
    group by user_id;
    

    请注意,我已从 selectgroup by 中删除了 source

    【讨论】:

      【解决方案2】:

      假设您正在运行 Postgres,如错误消息所示,您可以按如下方式进行条件聚合:

      select 
          user_id,
          max(created) filter(where source = 'QT') max_qt,
          max(created) filter(where source = 'AT') max_at
      from analytics.all_tx_bars_all
      group by user_id
      

      如果您的数据库不支持filter 语法,那么我们可以使用case 表达式:

      select 
          user_id,
          max(case when source = 'QT' then created end) max_qt,
          max(case when source = 'AT' then created end) max_at
      from analytics.all_tx_bars_all
      group by user_id
      

      【讨论】:

      • 感谢您的快速回复!不幸的是,这给了我以下错误:[Amazon](500310) Invalid operation: syntax error at or near "(" Position: 168; 为了给我的问题增加一点色彩,我在这里使用元数据库中的 SQL 工具
      • @TobiahAdam:我用不使用filter 语法的解决方案更新了我的答案。
      猜你喜欢
      • 1970-01-01
      • 2021-06-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-06-18
      • 2020-11-02
      相关资源
      最近更新 更多