【发布时间】:2011-12-19 11:24:05
【问题描述】:
有什么方法可以提高下面CTE查询的性能(@E和@R是实际系统中带索引的表):
DECLARE @id bigint = 1
DECLARE @E TABLE
(
id bigint,
name varchar(50)
)
DECLARE @R TABLE
(
child_id bigint,
parent_id bigint
)
INSERT INTO @E SELECT 1, 'one'
INSERT INTO @E SELECT 2, 'two'
INSERT INTO @E SELECT 3, 'three'
INSERT INTO @E SELECT 4, 'four'
INSERT INTO @E SELECT 5, 'five'
INSERT INTO @E SELECT 6, 'six'
INSERT INTO @E SELECT 7, 'seven'
INSERT INTO @R SELECT 1, 2
INSERT INTO @R SELECT 1, 3
INSERT INTO @R SELECT 3, 4
INSERT INTO @R SELECT 5, 4
INSERT INTO @R SELECT 3, 6
INSERT INTO @R SELECT 7, 4
; WITH cte
(
child_id,
parent_id
)
AS (
SELECT * FROM @R R
WHERE R.child_id = @id
UNION ALL
SELECT R.* FROM @R R
INNER JOIN cte ON CTE.parent_id = R.child_id
)
SELECT * FROM @E E
WHERE e.id = @id
UNION ALL
SELECT P.* FROM @E E
INNER JOIN cte ON 1=1
INNER JOIN @E P ON P.id = cte.parent_id
WHERE e.id = @id
ORDER BY 1
预期结果:
id | name
1 | one
2 | two
3 | three
4 | four
6 | six
在现实世界的数据中,我将处理@R 中的数百万行和@E 中的大约十万行。所以我想看看是否有什么我可以做的来挤出更多的性能。
编辑:到目前为止,只是为了澄清和总结,R 上有一个带有 child_id, parent_id 的聚集 pk 索引,向 @r.parent_id 添加索引也将提高连接性能。
有什么可以改进的吗?在使用inner join 1=1 进行 CTE 之后的一点是,这里有什么可以改进的地方吗?我可以做任何其他架构设计来获得具有更好性能的类似父子映射吗?
【问题讨论】:
-
确保任何用于连接的列都已编入索引,例如
child_id和parent_id等等 - 这将提高 JOIN 性能 -
你知道在你的真实数据中你可能有多少级别的亲子关系吗?
-
@marc_s 此表的 [child_id, parent_id] 上会有一个聚集索引。
-
@MarkBannister:现实世界的数据可能只下降到 10 级左右,最多 20 级,但没有直接限制。
-
@Seph:这还不够好 - 您应该在
(child_id)和(parent_id)上都有单独的索引以加快 JOIN 性能。如果您在(child_id, parent_id)上有一个复合索引,那么它可以单独用于child_id- 但不能单独用于parent_id(它需要两者)
标签: sql sql-server performance common-table-expression