【发布时间】:2014-06-19 06:51:58
【问题描述】:
我已经阅读了所有的论点:告诉 SQL 你想要什么,而不是如何得到它。使用基于集合的方法而不是过程逻辑。不惜一切代价避免使用游标和循环。
不幸的是,我已经绞尽脑汁好几个星期了,我不知道如何想出一种基于集合的方法来为按时间顺序排列的数据的顺序子集生成迭代 COUNT。
这是我正在处理的问题的具体应用。
我使用包含多年逐场比赛数据的数据库进行与足球相关的研究,这些数据当然是按年份、比赛和比赛的时间顺序排列的。数据库被加载到运行 MySQL 5.0 的 Web 服务器上。
我需要解决这个特定问题的字段包含在core 表中。以下是表格相关部分的一些示例数据:
GID | PID | OFF | DEF | QTR | MIN | SEC | PTSO | PTSD
--------------------------------------------------------
121 | 2455 | ARI | CHI | 2 | 4 | 30 | 17 | 10
121 | 2456 | ARI | CHI | 2 | 4 | 15 | 17 | 10
121 | 2457 | ARI | CHI | 2 | 3 | 53 | 17 | 10
121 | 2458 | ARI | CHI | 2 | 3 | 31 | 20 | 10
这些列分别代表:唯一的比赛标识符、唯一的比赛标识符、哪支球队在该比赛中处于进攻状态、哪支球队在该比赛中处于防守状态、比赛发生的季度和时间,以及进攻和防守的得分入戏。换句话说,在(假设的)第 121 场比赛中,亚利桑那红雀队在第 2457 场比赛(即进入第 2458 场比赛)中投篮得分。
我想做的是逐个游戏,逐秒检查几年的数据,并计算在任何给定的经过时间发生的任何可能的得分差异的次数。以下查询按经过的秒数和分数差异排列数据:
SELECT core.GID, core.PID, core.QTR, core.MIN, core.SEC, core.PTSO, core.PTSD,
((core.QTR - 1) * 900 + (900-(core.MIN * 60 + core.SEC))) AS secEl,
core.PTSO - core.PTSD AS oDif, (core.PTSO - core.PTSD) * -1 AS dDif
FROM core
ORDER BY secEl ASC, oDif ASC;
结果如下所示:
GID | PID | OFF | DEF | QTR | MIN | SEC | PTSO | PTSD | secEl | oDif | dDif
---------------------------------------------------------------------------------
616 | 100022 | CHI | MIN | 1 | 15 | 00 | 0 | 0 | 0 | 0 | 0
617 | 100169 | HOU | DAL | 1 | 15 | 00 | 0 | 0 | 0 | 0 | 0
618 | 100224 | PHI | SEA | 1 | 15 | 00 | 0 | 0 | 0 | 0 | 0
619 | 100303 | JAX | NYJ | 1 | 15 | 00 | 0 | 0 | 0 | 0 | 0
虽然看起来很漂亮,但我的目标不是按时间顺序对数据进行排序。相反,我想在一场 NFL 比赛中按顺序遍历 4,500 秒(四个 15 分钟的上节加上一个 15 分钟的加时赛)中的每一秒,并计算每一个得分差异发生的次数秒。
换句话说,我不想只计算 2002 年到 2013 年间一支球队在 1,800 秒(即第二节开始)时上升 21 分的次数。我想要计算一支球队在比赛中任意点上升 21 分的次数。最重要的是,我想对曾经发生的每一个分数差异(即-50、-49、-48、...、0、1、2、... 48、49、50、.. ..) 每场比赛的每一秒。
这通过一系列嵌套循环相对容易实现,但它不是最可重用的代码。
我想要做的是构造集合逻辑,该逻辑将COUNT 使用循环或游标每秒钟发生的每个分数差异的实例。结果列表如下:
secondsElapsed | scoreDif | Occurrences
-----------------------------------------
10 | -1 | 12
10 | 0 | 125517
10 | 1 | 0
10 | 2 | 3
这是一个示例查询,用于获取特定时间点(经过 3,000 秒)的特定分数差异 (+21) 的实例总数:
SELECT ((core.QTR - 1) * 900 + (900-(core.MIN * 60 + core.SEC))) AS timeElapsed,
(core.PTSO - core.PTSD) AS diff, COUNT(core.PTSO - core.PTSD) AS occurrences
FROM core
WHERE ((core.QTR - 1) * 900 + (900-(core.MIN * 60 + core.SEC))) = 3000
AND ABS(core.PTSO - core.PTSD) = 21
该查询返回以下结果:
timeElapsed | diff | occurrences
----------------------------------
3000 | 21 | 5
现在我想概括此查询以计算 每 秒经过的每个 差异的实例。
【问题讨论】:
-
您使用的是哪个 RDBMS?
-
COUNT(core.PTSO - core.PTSD) 没有做你认为它正在做的事情。我不完全确定你想要它做什么,但它正在做的是计算记录..你可能想使用 sum() 或其他一些运算符,但不计数,它几乎会产生相同的结果你传入的参数。
-
进一步说明,根据您对问题的描述,我真的无法确定您想要获得什么结果。我知道你想要做的事情可以在大多数 RDBMS 中的单个(虽然很长)SQL 查询中完成——如果你使用的是 mySQL,你可能不得不求助于使用临时表,否则,你应该不错。
-
@Joe 这些表被加载到 Web 服务器上的 SQL 数据库中。我正在使用 phpMyAdmin 运行查询。
-
@rourke,什么 SQl 数据库? Oracle、SQL Server、Postgre、mySQl?它有所作为。
标签: mysql sql cursor nested-loops procedural-programming