【问题标题】:Doing a group by on the given data set for stored procedure对存储过程的给定数据集进行分组
【发布时间】:2019-07-01 09:57:33
【问题描述】:

我有一个包含示例数据的表格,如下所示:

  systemuid       filename           mindatetime                 maxdatetime
    10006       monitor_7.dat   2019-06-05 03:06:18.001 AM  2019-06-06 03:06:11.0 AM
    72111       monitor_4.dat   2019-04-28 09:00:00 AM      2019-04-29 11:00:00 AM
    10006       monitor_5.dat   2019-04-28 07:00:00 AM      2019-04-28 10:00:00 AM
    90204       monitor_7.dat   2019-05-24 03:06:11.001 AM  2019-06-05 03:06:18.0 AM
    90204       monitor_4.dat   2019-04-28 09:30:00 AM      2019-04-29 23:00:00 PM
    72111       monitor_7.dat   2019-04-21 03:06:26.0 AM    2019-05-21 03:06:10.0 AM
    10006       monitor_5.dat   2019-04-28 02:00:00 PM      2019-04-28 06:00:00 PM
    72111       monitor_7.dat   2019-05-12 07:00:10.001 AM  2019-05-13 10:00:10.000 AM
    90204       monitor_5.dat   2019-04-28 09:00:00 AM      2019-04-28 03:00:00 PM
    10006       monitor_7.dat   2019-05-15 09:30:10.001 AM  2019-05-18 11:30:10.000 AM
    72111       monitor_4.dat   2019-04-28 07:00:00 AM      2019-04-29 11:00:00 AM
    10006       monitor_7.dat   2019-05-21 03:06:10.001 AM  2019-05-24 03:06:11.0 AM

我想通过将 systemuid 和文件名分组,然后按 mindatetime、maxdatetime 排序来组织数据。每个 systemuid 将有多个文件名,每个文件名都有多个时间戳。

  systemuid       filename           mindatetime                 maxdatetime
    10006       monitor_5.dat   2019-04-28 07:00:00 AM      2019-04-28 10:00:00 AM
    10006       monitor_5.dat   2019-04-28 02:00:00 PM      2019-04-28 06:00:00 PM
    10006       monitor_7.dat   2019-05-15 09:30:10.001 AM  2019-05-18 11:30:10.000 AM
    10006       monitor_7.dat   2019-05-21 03:06:10.001 AM  2019-05-24 03:06:11.0 AM
    10006       monitor_7.dat   2019-06-05 03:06:18.001 AM  2019-06-06 03:06:11.0 AM
    72111       monitor_4.dat   2019-04-28 07:00:00 AM      2019-04-29 11:00:00 AM
    72111       monitor_4.dat   2019-04-28 09:00:00 AM      2019-04-29 11:00:00 AM
    72111       monitor_7.dat   2019-04-21 03:06:26.0 AM    2019-05-21 03:06:10.0 AM
    72111       monitor_7.dat   2019-05-12 07:00:10.001 AM  2019-05-13 10:00:10.000 AM
    90204       monitor_4.dat   2019-04-28 09:30:00 AM      2019-04-29 23:00:00 PM
    90204       monitor_5.dat   2019-04-28 09:00:00 AM      2019-04-28 03:00:00 PM
    90204       monitor_7.dat   2019-05-24 03:06:11.001 AM  2019-06-05 03:06:18.0 AM

我需要它作为我的存储过程的游标。因此需要数据采用这种格式才能对记录执行功能。表的大小非常庞大,有数百万条记录。

【问题讨论】:

  • 你之前尝试过什么?结果是什么?这似乎是一个简单的order by 问题,但需要更多信息
  • mindatetimemaxdatetime 我假设以 CHAR / VARCHAR 格式存储?
  • @RaymondNijland 不,这些列是时间戳。
  • @Muhammadvakili Just a order by 将对整个数据集进行排序,我需要对每个 systemuid 和文件名的最小和最大日期时间进行排序。
  • 这不应该只为你工作ORDER BY systemuid, filename, mindatetime, maxdatetime 正如你提到的mindatetimemaxdatetimetimestamps

标签: sql postgresql stored-procedures stored-functions


【解决方案1】:

只使用窗口函数:

order by systemuid, filename, mindatetime, maxdatetime

如果您担心大型数据集的性能,请确保您在 (systemuid, filename, mindatetime, maxdatetime) 上有一个索引。

无论您是否有索引,在数据库中进行排序可能比在应用程序中进行排序更快。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-05-19
    • 2011-03-26
    • 2013-04-03
    • 2015-08-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-08-20
    相关资源
    最近更新 更多