【问题标题】:Tips about optimizing this multi-layered (with many layers of subqueries) SQL query有关优化此多层(具有多层子查询)SQL 查询的提示
【发布时间】:2017-12-01 16:38:39
【问题描述】:

对于这个 SQL 查询,我需要您的帮助。我有一个包含 6 层子查询的查询,目前的结构是这样的。我期待建议如何:

  1. 减少层数而不重复相同的语句(例如,我可以将 'case when E>200' 替换为 '(Case when T2.BB >100 then B+C else B+D end) > 200 ' 并在第 1 层中编写语句,从而消除第 2 层。我不能这样做,因为在我的原始查询中,我有一个计算列基于其子查询中的另一个计算列,然后基于另一个计算子查询中的列...所以重复代码 5/6 次会让我感到困惑并让我发疯...

  2. 避免使用 select 2.,选择 1.,同时仍将所有列 (F,E,A,B,C,D,T2.BB) 保留在最终输出中。我想这样做是因为在我的原始查询中有 5 个选择。* - 我觉得这会导致服务器做很多冗余工作并减慢查询执行速度。

非常感谢您的帮助!

Select 
    2.*,
    case when E > 200 then 'OK' else 'OH NO' end F
From
    (Select 
         1.*,
         Case when T2.BB >100 then B+C else B+D end E
     From
         (Select
              A, B, C, D, T2.BB
          From 
              T1
          Join 
              T2 on T1.A = T2.AA) 1
    ) 2

【问题讨论】:

  • 我们需要知道您使用的是什么数据库
  • “我觉得这会导致服务器做很多多余的工作”只有分析查询计划才能确定,因为 engien 可以在后台对其进行优化
  • 嗨@gjvdkamp。这是 Amazon Redshift。

标签: sql subquery amazon-redshift query-performance


【解决方案1】:

尝试 WITH 语句,它们看起来更简洁,因为它们有助于保持应用逻辑的顺序,所以它看起来像这样:

WITH
t1 as (
    select ...
    from src_table
)
,t2 as (
    select *, ...
    from t1
)
<<as much layers as needed>>

此外,如果您需要在 2 个不同的地方重用某些东西,您可以从任何后续语句中引用前面的 WITH 语句,即将该逻辑封装在一个地方

【讨论】:

  • 嗨,亚历克斯。感谢您的提示。我使用了您的方法并提高了 SQL 执行性能。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2014-11-03
  • 1970-01-01
  • 2018-01-13
  • 2023-03-14
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多