【问题标题】:SQL Server min max with intermediate record带有中间记录的 SQL Server 最小值最大值
【发布时间】:2019-03-18 12:52:33
【问题描述】:

如果这个问题之前已经回答过,我很抱歉,但我找不到它。也许是我的错误关键字。

我有这张桌子:

CREATE TABLE test1 
(
    Employee VARCHAR(10),
    Band VARCHAR(10),
    StartDate DATE,
    EndDate DATE
)

INSERT INTO test1 
VALUES ('Emp1', 'Band1', '2009-01-01', '2010-12-31'),
       ('Emp1', 'Band1', '2011-01-01', '2012-12-31'), 
       ('Emp1', 'Band1', '2013-01-01', '2013-08-31'),
       ('Emp1', 'Band2', '2013-09-01', '2013-12-31'),
       ('Emp1', 'Band2', '2014-01-01', '2014-06-30'),
       ('Emp1', 'Band1', '2014-07-01', '2014-12-31'),
       ('Emp1', 'Band1', '2015-01-01', '2018-08-31'),
       ('Emp2', 'Band1', '2012-01-01', '2014-12-31'),
       ('Emp2', 'Band1', '2015-01-01', '2018-03-31')

此表中的结果:

Employee   Band   StartDate   EndDate
----------------------------------------
Emp1       Band1  2009-01-01  2010-12-31
Emp1       Band1  2011-01-01  2012-12-31
Emp1       Band1  2013-01-01  2013-08-31
Emp1       Band2  2013-09-01  2013-12-31
Emp1       Band2  2014-01-01  2014-06-30
Emp1       Band1  2014-07-01  2014-12-31
Emp1       Band1  2015-01-01  2018-08-31
Emp2       Band1  2012-01-01  2014-12-31
Emp2       Band1  2015-01-01  2018-03-31

我要创建的是一个结果表,将每个employeeband 和最小start date 和最大end date 分组,但是当一个中间记录(band 存在于类似band 之间的中间,end date 应该被封顶并且类似band 中下一组的start date 应该再次重置。

Employee   Band   StartDate   EndDate
----------------------------------------
Emp1       Band1  2009-01-01  2013-08-31
Emp1       Band2  2013-09-01  2014-06-30
Emp1       Band1  2014-07-01  2018-08-31
Emp2       Band1  2012-01-01  2018-03-31

我已经尝试 CTE 来获取每个波段的最大值和最小值,并将其与原始表进行比较,但我仍然失败了。我也尝试过使用领先和滞后,但仍然失败。

很高兴

假设第二条记录的EndDate2012-02-01,我更喜欢结果仍然是第一个Band1组的一条记录。

Employee   Band   StartDate   EndDate
----------------------------------------
Emp1       Band1  2009-01-01  2013-08-31

结果的每一行仅在 Band 中有所不同,我可以计算出员工在移动到其他波段(不同波段)之前在某个波段停留了多长时间。

但拥有它是件好事。

【问题讨论】:

  • 样本数据最好使用DDL + DML。请edit您的问题包括它和您当前的尝试。另外,请用文字解释获得所需结果的逻辑。更多详情,read this.
  • 我希望现在更好。
  • 好多了。好样的!如果两个记录之间有间隙怎么办?假设第二条记录的开始日期为2011-02-01,您想要的结果是否应该忽略这个差距,或者它是否应该在数据中包含emp1band1 的两条记录?
  • 已编辑问题。感谢您指出。我希望结果忽略这个差距仍然为第一组输出一条记录。

标签: sql-server aggregate aggregate-functions


【解决方案1】:

显然,您希望在员工更改乐队时对行进行分组。这对于窗口函数来说是直截了当的。以下解决方案在带区更改时向行添加“更改”标志。请注意,它忽略了差距。将 DATEDIFF 检查添加到案例语句中,以查找此人与乐队关联的实际时间:

DECLARE @test1 TABLE(
    Employee VARCHAR(10),
    Band VARCHAR(10),
    StartDate DATE,
    EndDate DATE
);

INSERT INTO @test1 VALUES
('Emp1', 'Band1', '2009-01-01', '2010-12-31'),
('Emp1', 'Band1', '2011-01-01', '2012-12-31'),
('Emp1', 'Band1', '2013-01-01', '2013-08-31'),
('Emp1', 'Band2', '2013-09-01', '2013-12-31'),
('Emp1', 'Band2', '2014-01-01', '2014-06-30'),
('Emp1', 'Band1', '2014-07-01', '2014-12-31'),
('Emp1', 'Band1', '2015-01-01', '2018-08-31'),
('Emp2', 'Band1', '2012-01-01', '2014-12-31'),
('Emp2', 'Band1', '2015-01-01', '2018-03-31');

WITH cte1 AS (
    SELECT *,
        CASE WHEN LAG(Band) OVER (PARTITION BY Employee ORDER BY StartDate) = Band /* AND DATEDIFF(...) */ THEN 0 ELSE 1 END AS Chg
    FROM @test1
), cte2 AS (
    SELECT *,
        SUM(Chg) OVER (PARTITION BY Employee ORDER BY StartDate) AS Grp
    FROM cte1
)
SELECT Employee, Band, MIN(StartDate), Max(EndDate)
FROM cte2
GROUP BY Employee, Band, Grp

DB Fiddle

如果你想看看它是如何工作的,这是中间结果:

| Employee | Band  | StartDate           | EndDate             | Chg | Grp |
|----------|-------|---------------------|---------------------|-----|-----|
| Emp1     | Band1 | 01/01/2009 00:00:00 | 31/12/2010 00:00:00 | 1   | 1   |
| Emp1     | Band1 | 01/01/2011 00:00:00 | 31/12/2012 00:00:00 | 0   | 1   |
| Emp1     | Band1 | 01/01/2013 00:00:00 | 31/08/2013 00:00:00 | 0   | 1   |
| Emp1     | Band2 | 01/09/2013 00:00:00 | 31/12/2013 00:00:00 | 1   | 2   |
| Emp1     | Band2 | 01/01/2014 00:00:00 | 30/06/2014 00:00:00 | 0   | 2   |
| Emp1     | Band1 | 01/07/2014 00:00:00 | 31/12/2014 00:00:00 | 1   | 3   |
| Emp1     | Band1 | 01/01/2015 00:00:00 | 31/08/2018 00:00:00 | 0   | 3   |
| Emp2     | Band1 | 01/01/2012 00:00:00 | 31/12/2014 00:00:00 | 1   | 1   |
| Emp2     | Band1 | 01/01/2015 00:00:00 | 31/03/2018 00:00:00 | 0   | 1   |

【讨论】:

  • 感谢您的回答!它完美地解决了我当前的问题。对于那些需要考虑记录之间差距的人来说,John 的解决方案非常有效。
【解决方案2】:

这通常称为差距和岛屿

一种方法

示例

Declare @YourTable Table ([Employee] varchar(50),[Band] varchar(50),[Start] date,[End] date)
Insert Into @YourTable Values 
 ('Emp1','Band1','2009-01-01','2010-12-31')
,('Emp1','Band1','2011-01-01','2012-12-31')
,('Emp1','Band1','2013-01-01','2013-08-31')
,('Emp1','Band2','2013-09-01','2013-12-31')
,('Emp1','Band2','2014-01-01','2014-06-30')
,('Emp1','Band1','2014-07-01','2014-12-31')
,('Emp1','Band1','2015-01-01','2018-08-31')
,('Emp2','Band3','2012-01-01','2014-12-31')
,('Emp2','Band3','2015-01-01','2018-03-31')

;with cte as (
Select *,Grp = sum(Flg) over (Partition By Employee Order by [End])
 From (
        Select *,Flg = IsNull(datediff(DAY,Lag([End],1) over (Partition By Employee,Band Order by [End]) ,[Start]) - 1,1)
         From  @YourTable
      ) A
)
Select Employee
      ,Band
      ,[Start] = min([Start])
      ,[End]   = max([End])
 From cte
 Group By Employee,Band,Grp
 Order by Employee,max([End])

退货

Employee    Band    Start       End
Emp1        Band1   2009-01-01  2013-08-31
Emp1        Band2   2013-09-01  2014-06-30
Emp1        Band1   2014-07-01  2018-08-31
Emp2        Band3   2012-01-01  2018-03-31

如果它有助于可视化,CTE 会生成以下内容

注意标志和组列

【讨论】:

  • 哇!感谢您的关键字。现在我无法访问我的工作站。一旦我尝试了你的逻辑,我会告诉你的。到目前为止,我已经根据您的解决方案得到了这个想法。我会在接下来的 11 小时内回复您。
  • 感谢您的解决方案!我已经尝试过,当记录之间存在差距时效果很好。但是,即使存在差距,我也需要对它们进行分组。很抱歉我之前没有指定这一点。我相信您的回答会对其他人有所帮助!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-07-08
  • 1970-01-01
  • 2017-02-13
相关资源
最近更新 更多