【发布时间】:2024-03-09 11:30:02
【问题描述】:
我有以下架构中的数据:
| user_id | date | score |
| ------- | ------ | ------ |
| 1 | 201901 | 1 |
| 1 | 201902 | 2 |
| 1 | 201903 | 3 |
| 2 | 201901 | 1 |
| 2 | 201902 | -1 |
| 2 | 201903 | 2 |
我需要得出以下结果:
| user_id | one_score | two_score | three_score | max_score | min_score |
| ------- | ---------- | --------- | ----------- | --------- | --------- |
| 1 | 1 | 3 | 6 | 3 | 1 |
| 2 | 1 | 0 | 2 | 2 | -1 |
注意 one_score 是第一个结果的总和,two_score 是前两个结果的总和,而三个 score 是与 user_id 关联的前三个结果的总和。
到目前为止,我的查询的总体布局是:
SELECT
MAX(score),
MIN(score)
FROM scores
GROUP BY user_id
我不确定计算 one_score、two_score 和 three_score 的最佳方法是什么。一种可能的方法是为每种情况编写一个自定义聚合函数,将整个列作为输入:
SELECT
MAX(score),
MIN(score),
one_score(score),
two_score(score),
three_score(score)
FROM scores
GROUP BY user_id
我想知道是否有比这涉及窗口函数更好的方法。似乎我应该在每列中更改的是 sum 函数正在应用的行数,而不是为每种情况编写单独的函数。如何为滚动总和 one_score、two_score、three_score 编写窗口函数?
注意 - 这是一个从“真实世界”案例建模的简化案例,有两个不同之处:
- 它不是求和函数,而是数学表达式
- 范围将变化很大(最后 10、最后 30、最后 50 等),而不是 1、2、3 的范围。
【问题讨论】:
-
如何保证每个用户恰好有 3 个与之关联的分数?如果更少或更多应该怎么办?
标签: sql postgresql window-functions