【问题标题】:MySQL query, MAX() + GROUP BYMySQL 查询,MAX() + GROUP BY
【发布时间】:2011-08-05 04:09:42
【问题描述】:

愚蠢的 SQL 问题。我有一个这样的表('pid' 是自动递增的主要 col)

CREATE TABLE theTable (
    `pid` INT UNSIGNED PRIMARY KEY AUTO_INCREMENT,
    `timestamp` TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    `cost` INT UNSIGNED NOT NULL,
    `rid` INT NOT NULL,
) Engine=InnoDB;

实际表数据:

INSERT INTO theTable (`pid`, `timestamp`, `cost`, `rid`)
VALUES
  (1, '2011-04-14 01:05:07', 1122, 1),
  (2, '2011-04-14 00:05:07', 2233, 1),
  (3, '2011-04-14 01:05:41', 4455, 2),
  (4, '2011-04-14 01:01:11', 5566, 2),
  (5, '2011-04-14 01:06:06', 345, 1),
  (6, '2011-04-13 22:06:06', 543, 2),
  (7, '2011-04-14 01:14:14', 5435, 3),
  (8, '2011-04-14 01:10:13', 6767, 3)
;

我想获取每个 rid 的最新行的 PID(每个唯一 RID 1 个结果)。对于示例数据,我想:

pid | MAX(timestamp)      | rid
-----------------------------------
5   | 2011-04-14 01:06:06 | 1
3   | 2011-04-14 01:05:41 | 2
7   | 2011-04-14 01:14:14 | 3

我已尝试运行以下查询:

SELECT MAX(timestamp),rid,pid FROM theTable GROUP BY rid

我得到:

max(timestamp)     ; rid; pid
----------------------------
2011-04-14 01:06:06; 1  ; 1
2011-04-14 01:05:41; 2  ; 3
2011-04-14 01:14:14; 3  ; 7

返回的 PID 始终是 RID 第一次出现的 PID(行/pid 1 是第一次使用 rid 1,row/pid 3 是第一次使用 RID 2,row/pid 7 是第一次使用 rid 3用来)。虽然返回每个消除的最大时间戳,但 pid 不是原始表中时间戳的 pid。什么查询会给我正在寻找的结果?

【问题讨论】:

  • 你能显示你正在运行的确切查询的结果吗?
  • 正确的sample code(此处为 SQL 语句)比任何即席模式和示例数据格式都更有用。样品请使用CREATE TABLEINSERT ... VALUES。所需的结果不需要以示例代码的形式呈现,因为结果是代码的输出,而不是代码本身。

标签: mysql sql database relational-database


【解决方案1】:
SELECT t.pid, t.cost, to.timestamp, t.rid
FROM test as t
JOIN (
    SELECT rid, max(tempstamp) AS maxtimestamp
    FROM test GROUP BY rid
) AS tmax
    ON t.pid = tmax.pid and t.timestamp = tmax.maxtimestamp

【讨论】:

  • 你刚刚被@Catcall 打败了。 :) 谢谢!
【解决方案2】:

如果你想避免 JOIN,你可以使用:

SELECT pid, rid FROM theTable t1 WHERE t1.pid IN ( SELECT MAX(t2.pid) FROM theTable t2 GROUP BY t2.rid);

【讨论】:

  • 从数据上看,较高的PID不一定与较晚的时间戳相关。
  • 你是对的。它仅在时间戳未在程序中的任何位置修改且仅存储 de creation_date 时才有效。如果不是,因为 pid 是 autoinc 并且时间戳 current_timestamp 我假设更高的 PID 确实对应于以后的时间戳
【解决方案3】:
select *
from (
    select `pid`, `timestamp`, `cost`, `rid`
    from theTable 
    order by `timestamp` desc
) as mynewtable
group by mynewtable.`rid`
order by mynewtable.`timestamp`

希望我能帮上忙!

【讨论】:

  • 清晰、简短和简单的解决方案。
  • 这太棒了,太简单了。其他答案也可以,但我宁愿避免自己加入表格
  • 只有这个解决方案对我有用。可能是 max() 的解决方案不再适用于较新版本的 mysql。
【解决方案4】:

我在 rid 和时间戳上创建了一个索引。

SELECT test.pid, test.cost, test.timestamp, test.rid
FROM theTable AS test
LEFT JOIN theTable maxt 
ON maxt.rid = test.rid
AND maxt.timestamp > test.timestamp
WHERE maxt.rid IS NULL 

显示第 0 - 2 行(共 3 行,查询耗时 0.0104 秒)

此方法将从theTable(测试)中选择所有所需的值,并在所有时间戳高于测试中的时间戳(具有相同的消除)时加入自身(最大值)。当时间戳已经是测试中的最高时间戳时,maxt 上没有匹配项——这是我们正在寻找的——maxt 上的值变为 NULL。现在我们使用 WHERE 子句 maxt.rid IS NULL 或 maxt 上的任何其他列。

【讨论】:

    【解决方案5】:

    你也可以有这样的子查询:

    SELECT ( SELECT MIN(t2.pid)
             FROM test t2
             WHERE t2.rid = t.rid
               AND t2.timestamp = maxtimestamp
           ) AS pid 
         , MAX(t.timestamp) AS maxtimestamp
         , t.rid
    FROM test t
    GROUP BY t.rid
    

    但是这样一来,如果您希望cost 包含在显示的列等中,您将需要一个子查询。

    所以,group byjoin 是更好的解决方案。

    【讨论】:

      【解决方案6】:

      (在 PostgreSQL 9.something 中测试)

      识别消除和时间戳。

      select rid, max(timestamp) as ts
      from test
      group by rid;
      
      1   2011-04-14 18:46:00
      2   2011-04-14 14:59:00
      

      加入它。

      select test.pid, test.cost, test.timestamp, test.rid
      from test
      inner join 
          (select rid, max(timestamp) as ts
          from test
          group by rid) maxt
      on (test.rid = maxt.rid and test.timestamp = maxt.ts)
      

      【讨论】:

      • 魔术,工作得很好。知道为什么“SELECT MAX(timestamp),rid,pid FROM theTable GROUP BY rid”不起作用吗?
      • 因为您希望 for every ridGROUP BY rid)显示“最大时间戳 ”(MAX(timestamp)),对于该行,具有最大时间戳,相关的 pid。这就是你的想法卡住的地方。作为 Catcall 的解决方案,您需要一个“窗口”函数来执行此操作,或者将 JOIN 分组到分组子查询中。 MYSQL 没有窗口函数。
      • 更糟糕的是,MySQL 不会引发错误,而是从(随机)行中获取 pid。
      • @codinghands:因为 MySQL 中的一个错误功能允许您从 GROUP BY 子句中省略一些未聚合的列。 dev.mysql.com/doc/refman/5.5/en/group-by-hidden-columns.html 不能省略不好的列;它能够省略在功能上不依赖于任何不良列的列。
      • @ypercube @Catcall 感谢您的回复 - 很高兴知道未来。获取一个没有错误的随机 pid 似乎很疯狂......
      【解决方案7】:

      试试:

      select pid,cost, timestamp, rid from theTable order by timestamp DESC limit 2;
      

      【讨论】:

      • 这只返回最新的 2 个条目。它必须是每个 RID 的最新行,每个 RID 1 个。
      猜你喜欢
      • 2019-08-16
      • 1970-01-01
      • 1970-01-01
      • 2022-01-04
      • 1970-01-01
      • 1970-01-01
      • 2015-12-10
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多