优化 ORACLE 上的查询。尝试索引答案

【问题标题】：optimize query on ORACLE. tried index优化 ORACLE 上的查询。尝试索引
【发布时间】：2012-05-08 03:27:33
【问题描述】：

我有这个查询，我想通过添加适当的索引来提高它的性能。

DELETE FROM MYTAB1 WHERE MYID1 IN (SELECT MYID2 FROM MYTAB2);

我不熟悉索引的语法和它们所需的设置类型。请提供相同的。这里的主要问题是 MYTAB1 有数百万条记录，因此查询需要很多时间。但是，MYTAB2 只有 1000 条记录。 MYID1 是 MYTAB1 的主键

我已尝试创建索引：

CREATE INDEX IDX_TAB1_ID1 ON MYTAB1(MYID1);

它对查询的性能没有太大影响。

我运行了解释计划并得到了这个：

PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------------   
| Id  | Operation             | Name          | Rows  | Bytes |TempSpc| Cost (%CPU)|
------------------------------------------------------------------------------------
|   0 | DELETE STATEMENT      |               | 63977 |    11M|       | 62216   (2)|
|   1 |  DELETE               | MYTAB1        |       |       |       |            |
|   2 |   HASH JOIN RIGHT SEMI|               | 63977 |    11M|  7688K| 62216   (2)|
|   3 |    TABLE ACCESS FULL  | MYTAB2        |   437K|  2561K|       |  1189   (2)|
|   4 |    TABLE ACCESS FULL  | MYTAB1        |  3761K|   678M|       | 24718   (4)|   
------------------------------------------------------------------------------------

【问题讨论】：

那么请阅读文档，创建索引非常简单。回答“告诉我所有关于索引及其设置”的问题需要一本不那么短的书。
运行这个：EXPLAIN PLAN FOR DELETE FROM MYTAB1 WHERE MYID1 IN (SELECT MYID2 FROM MYTAB2);然后：从表中选择*（DBMS_XPLAN.DISPLAY）；发布结果
我已编辑问题以包含查询计划
据此，MYTAB2 有 437,000 行。
啊，但优化器正在读取不同的统计数据。如果此表具有高度可变的行数，则使用 DBMS_Stats 包 i) 删除表统计信息和 ii) 锁定表统计信息。优化器将调用动态采样来计算查询执行时的行数，然后应该生成更好的执行计划。

标签： database oracle indexing query-performance

【解决方案1】：

“问题是MYTAB2只有1000条记录！”

是的，但相关数据点是 MYTAB1 中有多少记录与那一千条记录匹配？该数字代表整个表格的百分之几？ MYTAB1 中这些记录的分布是什么？

如果您希望删除 MYTAB1 中 20% 的行，则索引只会使性能变差（如果优化器愚蠢到无法使用它）。如果您只删除 MYTAB1 中 0.1% 的记录，但这些记录分布在表中的每个块中，那么再次全表扫描是更有效的选择。

调优没有简单的解决方案。它总是取决于许多不同因素的相互作用。您希望多久执行一次此删除操作？您是否拥有企业版许可证和大量备用 CPU 容量？以此类推。

如果 MYID1 是 MYTAB1 的主键，那么该列上应该已经有一个 UNIQUE 索引。所以你不需要创建一个新的索引。

除非您是那些不费心在您的表上应用完整性约束的地方之一。那是不好的做法。除了强制完整性的明显好处外，约束还为优化器提供了有用的信息，从而导致更好的执行计划。

无论如何，您现在发布的解释计划中清楚地说明了问题的根源。您说 MYTAB2 只有一千行，但优化器似乎认为它有四十三万七千行。因此，显然您需要在该表上收集新的统计数据：

 exec dbms_state.gather_table_stats(ownname=>user, tabname=>'MYTAB2',estimate_percent=>100)

我想 MYTAB1 的统计数据是正确的，它确实有大约 370 万行？如果是这样，索引查找将是性能最高的选项。您需要检查您在该主键列上是否有唯一索引：

 select i.index_name, i.uniqueness
 from user_indexes i
     join user_ind_columns c
         on ( i.index_name =  c.index_name)
 where i.table_name = 'MYTAB1'
 and c.column_name = 'MYID1'

如果您没有索引，则需要创建一个：

 create unique index mytab1_uidx on mytab1(myid1)
 /

如果您有一个索引但它不是唯一的，那么您可能应该删除它并建立一个唯一索引。

请注意，如果您弄错了并且该列不是主键 - 即它有重复项 - 那么 CREATE INDEX 语句将失败。万一你有一个更大的问题，你需要思考。

"但是 [MYTAB2] 包含的行数非常多不稳定的......基本上有些行被添加到表中然后有些是删除并继续处理“

在这种情况下，有任何固定的统计数据是有帮助的。更好的办法是强制优化器在运行时动态生成统计信息。

exec dbms_state.delete_table_stats(ownname=>user, tabname=>'MYTAB2')
exec dbms_state.lock_table_stats(ownname=>user, tabname=>'MYTAB2')

删除表的统计信息然后将其锁定将强制数据库在您每次将表包含在查询中时为其生成统计信息，前提是您启用了动态采样。每当您运行该删除语句时，这应该会生成一个更好的执行计划，而不管 MYTAB2 在那一刻碰巧持有多少行。

Find out more.

【讨论】：

MYID1 是 MYTAB1 的主要用户
我觉得如果按照MYID1排序的话，要删除的记录会很接近甚至相邻

【解决方案2】：

优化器认为 MYTAB2 有大约 437,000 行，因此您尝试删除表中大约 11.6% 的行。如果 MYTAB2 实际上只有 1,000 行，这意味着 MYTAB2 上的统计信息已过时。如果你在桌子上收集统计数据

BEGIN
  DBMS_STATS.GATHER_TABLE_STATS( <<owner of the table>>,
                                 'MYTAB2' );
END;

然后重新运行查询计划，计划是否改变？查询是否运行得更快？

下一个问题是为什么优化器认为MYTAB2 有这么多行。这是一个未声明为全局临时表的临时表吗？过去的表格是否大得多，但后来您永久删除了 437,000 行中的 436,000 行？

【讨论】：

它不是一个临时表，但是它包含的行数非常不稳定
@MozenRath - 导致波动的原因是什么？是否有可以挂钩的加载过程，以便在行数发生重大变化时收集表的统计信息？
基本上一些行被添加到表中，然后一些被删除并且过程继续。我会尝试停止这种情况，然后尝试收集统计数据。

【解决方案3】：

这是一个经典问题。有时您最好创建一个包含要保存的行的新表，然后将 new_table 重命名为 original_table。

总纲：

create table new_table as 
select * from original_table 
where myid1 not in (select myid2 from mytab2)
;

drop table original_table;

rename new_table to original_table;

更多活动详情：

Bulk Delete using CTAS Method
a.  Create table new_table with nologging
CREATE TABLE new_table NOLOGGING (….);
b.  Insert  /*+ APPEND */ into new_table select the records you want to keep from current_table.
c.  Create the indexes on the new_table with NOLOGGING  (*)
d.  Create constraints, grants etc.
e.  Drop current_table.
f.  Rename new_table to current.
g.  Backup the data.
(*) If the data left is so small or there are a lot of dependencies on the table (views, procedures, functions, etc) the following steps can be used instead of c-g above:
c.  Disable constraints on current_table.
d.  Truncate current_table;
e.  Make indexes unusable 
f.  Alter current_table NOLOGGING 
g.  Insert  /*+ APPEND */ into current_table 
select * from new_table; 
h.  commit;
i.  enable constraints
j.  Alter current_Table and indexes to LOGGING
k.  Backup the data
l.  drop table new_table;

【讨论】：

如果数据量很大，可能并不简单。我曾与尝试过删除但始终无法使其正常工作的人一起工作，然后使用 CTAS，他们在 5 小时内就完成了。
问题是MYTAB2只有1000条记录！

【解决方案4】：

Oracle 10.2 中创建索引的文档是here。

你需要这样的东西：

create index index_name on table_name(column_name);

【讨论】：

我已经读过并且已经创建了这个索引。我想知道的是根据我提供的查询可能为索引推荐的任何设置，例如在线/离线（不知道这意味着什么）等
没有特别推荐。你能重申你的问题吗？这听起来像，“我已经创建了一个索引，但查询仍然很慢”......即。性能调整问题而不是如何创建索引问题。
@DavidAldridge，恕我直言，我认为您无意中被 OP 问题误导了。按照我的阅读方式，他们在优化查询之后，索引问题是一个红鲱鱼。
我认为索引会有所帮助，但可惜我猜他们不会
除非你运行解释计划，否则你不知道它是否被使用。