【问题标题】:How to generalize a sequential COUNT() of chronological data without loops or cursors?如何在没有循环或游标的情况下概括按时间顺序排列的数据的顺序 COUNT()?
【发布时间】:2014-06-19 06:51:58
【问题描述】:

我已经阅读了所有的论点:告诉 SQL 你想要什么,而不是如何得到它。使用基于集合的方法而不是过程逻辑。不惜一切代价避免使用游标和循环。

不幸的是,我已经绞尽脑汁好几个星期了,我不知道如何想出一种基于集合的方法来为按时间顺序排列的数据的顺序子集生成迭代 COUNT

这是我正在处理的问题的具体应用。

我使用包含多年逐场比赛数据的数据库进行与足球相关的研究,这些数据当然是按年份、比赛和比赛的时间顺序排列的。数据库被加载到运行 MySQL 5.0 的 Web 服务器上。

我需要解决这个特定问题的字段包含在core 表中。以下是表格相关部分的一些示例数据:

   GID | PID  | OFF | DEF | QTR | MIN | SEC | PTSO | PTSD
  --------------------------------------------------------
   121 | 2455 | ARI | CHI |   2 |   4 |  30 |   17 |   10
   121 | 2456 | ARI | CHI |   2 |   4 |  15 |   17 |   10 
   121 | 2457 | ARI | CHI |   2 |   3 |  53 |   17 |   10 
   121 | 2458 | ARI | CHI |   2 |   3 |  31 |   20 |   10 

这些列分别代表:唯一的比赛标识符、唯一的比赛标识符、哪支球队在该比赛中处于进攻状态、哪支球队在该比赛中处于防守状态、比赛发生的季度和时间,以及进攻和防守的得分入戏。换句话说,在(假设的)第 121 场比赛中,亚利桑那红雀队在第 2457 场比赛(即进入第 2458 场比赛)中投篮得分。

我想做的是逐个游戏,逐秒检查几年的数据,并计算在任何给定的经过时间发生的任何可能的得分差异的次数。以下查询按经过的秒数和分数差异排列数据:

SELECT core.GID, core.PID, core.QTR, core.MIN, core.SEC, core.PTSO, core.PTSD, 
    ((core.QTR - 1) * 900 + (900-(core.MIN * 60 + core.SEC))) AS secEl, 
    core.PTSO - core.PTSD AS oDif, (core.PTSO - core.PTSD) * -1 AS dDif
FROM core 
ORDER BY secEl ASC, oDif ASC;

结果如下所示:

   GID | PID    | OFF | DEF | QTR | MIN | SEC | PTSO | PTSD | secEl | oDif | dDif
 ---------------------------------------------------------------------------------
   616 | 100022 | CHI | MIN |   1 |  15 |  00 |    0 |    0 |     0 |    0 |    0
   617 | 100169 | HOU | DAL |   1 |  15 |  00 |    0 |    0 |     0 |    0 |    0
   618 | 100224 | PHI | SEA |   1 |  15 |  00 |    0 |    0 |     0 |    0 |    0
   619 | 100303 | JAX | NYJ |   1 |  15 |  00 |    0 |    0 |     0 |    0 |    0 

虽然看起来很漂亮,但我的目标不是按时间顺序对数据进行排序。相反,我想在一场 NFL 比赛中按顺序遍历 4,500 秒(四个 15 分钟的上节加上一个 15 分钟的加时赛)中的每一秒,并计算每一个得分差异发生的次数秒。

换句话说,我不想只计算 2002 年到 2013 年间一支球队在 1,800 秒(即第二节开始)时上升 21 分的次数。我想要计算一支球队在比赛中任意点上升 21 分的次数。最重要的是,我想对曾经发生的每一个分数差异(即-50、-49、-48、...、0、1、2、... 48、49、50、.. ..) 每场比赛的每一秒。

这通过一系列嵌套循环相对容易实现,但它不是最可重用的代码。

我想要做的是构造集合逻辑,该逻辑将COUNT 使用循环或游标每秒钟发生的每个分数差异的实例。结果列表如下:

   secondsElapsed | scoreDif | Occurrences
  -----------------------------------------
               10 |       -1 |          12
               10 |        0 |      125517
               10 |        1 |           0
               10 |        2 |           3

这是一个示例查询,用于获取特定时间点(经过 3,000 秒)的特定分数差异 (+21) 的实例总数:

SELECT ((core.QTR - 1) * 900 + (900-(core.MIN * 60 + core.SEC))) AS timeElapsed, 
    (core.PTSO - core.PTSD) AS diff, COUNT(core.PTSO - core.PTSD) AS occurrences 
FROM core 
WHERE ((core.QTR - 1) * 900 + (900-(core.MIN * 60 + core.SEC))) = 3000 
    AND ABS(core.PTSO - core.PTSD) = 21

该查询返回以下结果:

   timeElapsed | diff | occurrences
  ----------------------------------
          3000 |   21 |           5 

现在我想概括此查询以计算 秒经过的每个 差异的实例。

【问题讨论】:

  • 您使用的是哪个 RDBMS?
  • COUNT(core.PTSO - core.PTSD) 没有做你认为它正在做的事情。我不完全确定你想要它做什么,但它正在做的是计算记录..你可能想使用 sum() 或其他一些运算符,但不计数,它几乎会产生相同的结果你传入的参数。
  • 进一步说明,根据您对问题的描述,我真的无法确定您想要获得什么结果。我知道你想要做的事情可以在大多数 RDBMS 中的单个(虽然很长)SQL 查询中完成——如果你使用的是 mySQL,你可能不得不求助于使用临时表,否则,你应该不错。
  • @Joe 这些表被加载到 Web 服务器上的 SQL 数据库中。我正在使用 phpMyAdmin 运行查询。
  • @rourke,什么 SQl 数据库? Oracle、SQL Server、Postgre、mySQl?它有所作为。

标签: mysql sql cursor nested-loops procedural-programming


【解决方案1】:

您的描述相当混乱,但如果您想“在不使用循环或游标的情况下计算每一秒所有可能的分数差异”,那么我会这样做:

1) 建立一个工作表(临时表#或表数据类型@)并用你想要的时间增量填充它,例如

   QTR | MIN | SEC |  
    1 |  00 |  01
    1 |  00 |  02
..
    1 |  01 |  59
    1 |  02 |  00
    1 |  02 |  01
    1 |  02 |  02
..
    4 |  15 |  59 

2) 然后将其用作查询的基础。将您感兴趣的游戏列表与工作表交叉连接,为您提供每场比赛和该比赛中每一分钟的表格。

3) 将 (2) 的结果左连接到上面的查询中?

使用此结果集,您可以查看整个游戏并根据需要求和/计数,而无需循环。

【讨论】:

    【解决方案2】:

    不确定这是否能解决您的问题,但您可以尝试在分区上使用 row_number...

    SELECT ROW_NUMBER() OVER (PARTITION BY <column> ORDER BY <column>) AS aColumn, aColumn FROM aTable
    

    【讨论】:

    • 这看起来是一种优雅的方法,但不幸的是,ROW_NUMBER() 在 MySQL 中不受支持。
    【解决方案3】:

    我使用子查询和两个变量来定义时间点和另一个变量来定义点差。

    然后查询返回 Diff,然后是进攻方的次数,然后是防守方和总次数。

    SET @Diff INT = 7;
    SET @Seconds INT = 1530;
    
    SELECT ABS(core.PTSO - core.PTSD) AS diff, SUM(CASE WHEN core.PTSO - core.PTSD <= 0 THEN 1 ELSE 0 END) OffensiveTimes, SUM(CASE WHEN core.PTSO - core.PTSD >= 0 THEN 1 ELSE 0 END) DefensiveTimes, SUM(1) TotalTimes
    
    FROM (SELECT core.GID, core.PID, core.QTR, core.MIN, core.SEC, core.PTSO, core.PTSD, 
        ((core.QTR - 1) * 900 + (900-(core.MIN * 60 + core.SEC))) AS secEl, 
        core.PTSO - core.PTSD AS oDif, (core.PTSO - core.PTSD) * -1 AS dDif
    FROM core 
    ) core
    WHERE secEl = @Seconds    AND ABS(core.PTSO - core.PTSD) = @Diff
    GROUP BY ABS(core.PTSO - core.PTSD);
    

    这会为您提供的小数据集返回这个

    7 diff, 0 OffensiveTimes, 1 DefensiveTimes, 1 Times

    希望这就是你要找的东西 :)

    【讨论】:

    • 这个查询看起来很有希望,但它返回一个语法错误。是不是和MySql 5.x不兼容?
    • 啊,那是为 MSSql 准备的,我会在周末尝试为 MySQL 制作一个工作版本,听起来很有趣:)
    • 再看一下@RourkeDecker,我在SQLFiddle中用相同的测试数据集进行了检查,得到了工作结果。不同之处在于变量声明使用 SET 并在每条语句后使用分号。
    猜你喜欢
    • 2012-10-15
    • 1970-01-01
    • 2016-07-01
    • 2011-05-20
    • 2013-06-06
    • 2019-11-01
    • 2017-09-02
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多