【问题标题】:LAST_VALUE() with ASC and FIRST_VALUE with DESC return different results带有 ASC 的 LAST_VALUE() 和带有 DESC 的 FIRST_VALUE 返回不同的结果
【发布时间】:2016-01-21 08:50:35
【问题描述】:

我在 Google BigQuery 中使用 LAST_VALUE() 窗口函数时遇到问题。

据我了解,以下两列应该返回相同的结果,但实际上它们返回的结果不同,似乎带有FIRST_VALUE() 的那一列是正确的。

SELECT
  FIRST_VALUE(status) OVER (PARTITION BY userId ORDER BY timestamp DESC), 
  LAST_VALUE(status) OVER (PARTITION BY userId ORDER BY timestamp ASC)
FROM
  [table]

我有错吗?

【问题讨论】:

标签: sql google-bigquery


【解决方案1】:

当 OVER() 函数具有 (ORDER BY) 时,它们的工作方式有一个微妙之处:它们以增量方式工作。

查看此查询:

SELECT x, y, 
       FIRST_VALUE(x) OVER(ORDER BY y) first, 
       LAST_VALUE(x) OVER(ORDER BY y DESC) last,
       SUM(x) OVER() plain_sum_over, 
       SUM(x) OVER(ORDER BY y) sum_over_order
FROM (SELECT 1 x, 1 y),(SELECT 2 x, 2 y),(SELECT 3 x, 3 y),(SELECT 4 x, 4 y)

plain_sum_oversum_over_order 揭示了秘密:通过 ORDER BY,您可以获得递增的结果 - 这就是您在结果中看到的。

【讨论】:

  • 谢谢!我了解 SUM() 可以增量工作,但 LAST_VALUE() 也可以增量工作?如果我想获取每个用户的最后状态,最好的方法是什么?
  • 好的。我想现在我理解了这种行为。因此,当您在没有窗口框架子句的 OVER 子句中使用 ORDER BY 时,默认的窗口框架是 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW。这是正确的吗?
  • 对于其他问题,请开始一个新问题 - 如果它回答了原始问题,请接受此答案。
猜你喜欢
  • 2013-03-01
  • 1970-01-01
  • 2018-09-08
  • 2021-09-08
  • 2021-10-31
  • 1970-01-01
  • 2018-12-27
  • 2014-04-21
  • 1970-01-01
相关资源
最近更新 更多