SQL Server - 跨行汇总日期范围，同时保留间隙答案

【问题标题】：SQL Server - Summarize date ranges across rows while preserving gapsSQL Server - 跨行汇总日期范围，同时保留间隙
【发布时间】：2020-10-07 10:50:03
【问题描述】：

我想知道这是否可能，但我认为我的措辞可能是我很难找到它的原因。

这是我的场景。

看到下面的选择结果了吗？

| Column A | Column B | Column C |
|   001    | 09-10-20 | 09-11-20 | 
|   001    | 09-11-20 | 09-16-20 | 
|   001    | 09-16-20 | 10-20-20 | 
|   001    | 10-20-20 | 11-11-20 | 
|   001    | 11-12-20 | 11-13-20 | 
|   001    | 11-14-20 | 11-16-20 | 
|   001    | 11-16-20 | 11-20-20 | 
|   001    | 11-20-20 | 11-21-20 |

有没有办法让它输出为 v ？

| Column A | Column B | Column C |
|   001    | 09-10-20 | 11-11-20 | 
|   001    | 11-12-20 | 11-13-20 | 
|   001    | 11-14-20 | 11-21-20 |

老实说，到目前为止，我认为仅使用 SQL 似乎不太可能，但我想我还是会问它。

我已经看过并且确实看到了识别差距和识别重叠的方法，但我仍然无法理解如何仅使用 SQL 来完成这项工作。

通常我只需要在 SQL 之外使用另一段代码筛选输出，然后从表 A 中给我表 B。但这需要额外的开销，我宁愿只学习如何在 SQL 中执行此操作。

【问题讨论】：

标签： sql sql-server select

【解决方案1】：

您可以使用lag() 和累积总和来定义组。然后聚合：

select a, min(b), max(c)
from (select t.*,
             sum(case when prev_c >= c then 0 else 1 end) over (partition by a order by b) as grp
      from (select t.*,
                   lag(c) over (partition by a order by b) as prev_c
            from t
           ) t
     ) t
group by a, grp;

这个问题是间隙和孤岛问题的一个例子。使用lag() 和累积和来识别“岛屿”是解决这类问题的一种方法。

【讨论】：

谢谢！这不是 1:1，但这让我找到了我需要的确切解决方案。

【解决方案2】：

SNODGRASS 的经典方法是：

WITH T  
AS (SELECT F.[Column B], L.[Column C], F.[Column A]
    FROM   T_INTERVAL_ITV AS F  
           JOIN T_INTERVAL_ITV AS L  
                ON F.[Column C] <= L.[Column C]
                   AND F.[Column A] = L.[Column A]
           INNER JOIN T_INTERVAL_ITV AS E      
                 ON F.[Column A] = E.[Column A]  
    GROUP  BY F.[Column B], L.[Column C],  F.[Column A]  
    HAVING COUNT(CASE  
                    WHEN (E.[Column B] < F.[Column B] AND F.[Column B] <= E.[Column C])  
                          OR (E.[Column B] <= L.[Column C] AND L.[Column C] < E.[Column C])
                    THEN 1  
                 END) = 0)  
SELECT [Column A], [Column B], MIN([Column C]) AS [Column C]  
FROM   T  
GROUP  BY [Column A], [Column B];

【讨论】：