【问题标题】:Create Index on new column for large table in Oracle在 Oracle 中为大表的新列创建索引
【发布时间】:2016-01-22 04:48:19
【问题描述】:

我有一个超过 1000 万行的表。我在该表上创建了一个新列,然后尝试对其进行索引:

create index myTable_idx_myColumn on myTable(myColumn);

该查询在大约一个小时后超时。然后我用NOLOGGING 选项重试了它,大约一个小时后成功完成。

问题解决了,对吧?不幸的是不是,因为那只是用于开发数据库。 prod 数据库有超过 2500 万行,所以理想情况下,我想在创建索引之前找到一个更快的解决方案,以避免不必要的停机。

对我来说奇怪的是,据我了解,Oracle 默认情况下不包含null 索引值(这是我想要的)。对我来说,这意味着它应该只创建一个空白索引,因为创建索引时新列中的所有值都是null。我知道它需要检查所有 1000 万行以确保它们是 null,但即使这样似乎也不应该花费将近一个小时...

有没有一种快速的方法可以为大表上的新列(即所有值都是null)添加索引?

【问题讨论】:

  • 为什么只需要在空列上建立索引?如果您想要索引中的所有行(rowids),那么您需要创建复合索引,其中至少有一列不为空。
  • @clq 这些值仅为空,因为它是一个全新的列。新行将获取值,并且基于这些值进行查询是很常见的,因为它是另一个表的外键。
  • 您可以做很多事情。创建索引需要这么长时间一定是有原因的。 25M不是很多。最好问问你的dba。 :) 一种技术选择可能是运行并行索引创建。一种非技术选项是安排您的创建索引语句并在周末运行。

标签: oracle indexing oracle10g database-performance


【解决方案1】:

有一些方法可以让它更快,但它们可能不是必需的。

1000 万行是一个相对较小的数字。尽管如果行非常宽,情况可能会有所不同。对于性能问题,知道段大小通常比知道行数更好。段大小和硬件知识将帮助您做出非常粗略的估计。例如,“表是 100GB,SAN 以 100MB/秒的速度单线程读取,因此仅扫描表需要 17 分钟......”。

--Find the segment size in gigabytes.
--No matter how many rows there are this may be the amount of I/O processed.
select sum(bytes)/1024/1024/1024 gb
from dba_segments
where segment_name = 'MYTABLE';

在这个简单的示例中,我的 PC 在 5 秒内创建了 1000 万行。

--Create table.
drop table myTable;
create table myTable(id number, myColumn varchar2(100)) nologging;

--Insert 10 million rows.  Takes 9 seconds on my PC.
begin
    for i in 1 .. 100 loop
        insert /*+ append */ into myTable
          select level, null from dual connect by level <= 100000;
        commit;
    end loop;
end;
/

--Create index.  Takes 5 seconds on my PC.
create index myTable_idx_myColumn on myTable(myColumn);

那么你的机器上发生了什么?要找出答案,首先需要找到CREATE INDEX ... 语句的SQL_ID。在建立索引时,运行以下命令:

--Find the SQL_ID.
select sql_id, sql_text, elapsed_time/1000000 seconds
from v$sql
where users_executing > 0
order by seconds desc;

有很多方法可以从这里开始,我更喜欢 SQL 监控。如果语句正在运行或“最近”运行,则监控数据应该仍然存在。将 SQL_ID 插入此 SQL 语句以获取报告:

--Generate SQL Monitoring report.
--(This feature requires licensing, but if this is the first time you use it, it's
-- reasonable to consider this "testing".  Buy it if you like it.)
select dbms_sqltune.report_sql_monitor('gb7tu2jpwng3q') from dual;

报告中有很多数据。这需要一段时间才能理解,但通常它会包含解决这类问题所需的大部分内容。首先,查看活动 (%) - 哪个步骤花费的时间最长?然后看看细节——它在等什么?看看Read和Write字节,对硬件来说合理吗?

SQL Monitoring Report

SQL Text
------------------------------
create index myTable_idx_myColumn on myTable(myColumn)

Global Information
------------------------------
 Status              :  DONE                              
 Instance ID         :  1                                 
 Session             :  JHELLER (133:56633)               
 SQL ID              :  gb7tu2jpwng3q                     
 SQL Execution ID    :  16777216                          
 Execution Started   :  10/23/2015 00:34:32               
 First Refresh Time  :  10/23/2015 00:34:36               
 Last Refresh Time   :  10/23/2015 00:34:37               
 Duration            :  5s                                
 Module/Action       :  PL/SQL Developer/SQL Window - New 
 Service             :  orcl12                            
 Program             :  plsqldev.exe                      

Global Stats
================================================================================================
| Elapsed |   Cpu   |    IO    | Application | PL/SQL  | Buffer | Read | Read  | Write | Write |
| Time(s) | Time(s) | Waits(s) |  Waits(s)   | Time(s) |  Gets  | Reqs | Bytes | Reqs  | Bytes |
================================================================================================
|    4.72 |    2.67 |     1.84 |        0.21 |    0.00 |  15594 | 3904 | 312MB |   795 | 192MB |
================================================================================================

SQL Plan Monitoring Details (Plan Hash Value=564701026)
========================================================================================================================================================================================================
| Id |        Operation         |         Name         |  Rows   | Cost |   Time    | Start  | Execs |   Rows   | Read | Read  | Write | Write |  Mem  | Temp  | Activity |      Activity Detail       |
|    |                          |                      | (Estim) |      | Active(s) | Active |       | (Actual) | Reqs | Bytes | Reqs  | Bytes | (Max) | (Max) |   (%)    |        (# samples)         |
========================================================================================================================================================================================================
|  0 | CREATE INDEX STATEMENT   |                      |         |      |         2 |     +4 |     1 |        1 |      |       |       |       |       |       |          |                            |
|  1 |   INDEX BUILD NON UNIQUE | MYTABLE_IDX_MYCOLUMN |         |      |         2 |     +4 |     1 |        1 |      |       |       |       |       |       |    25.00 | Cpu (1)                    |
|  2 |    SORT CREATE INDEX     |                      |    100K |      |         4 |     +2 |     1 |      10M | 3656 | 192MB |   795 | 192MB |   75M |  202M |    75.00 | Cpu (2)                    |
|    |                          |                      |         |      |           |        |       |          |      |       |       |       |       |       |          | direct path write temp (1) |
|  3 |     TABLE ACCESS FULL    | MYTABLE              |    100K |   46 |         1 |     +4 |     1 |      10M |  248 | 120MB |       |       |       |       |          |                            |
========================================================================================================================================================================================================

我希望您会看到一些“奇怪”的事件。可能是某种表锁定,因为其他进程正在锁定该表。

如果它只是一个巨大的表格并且需要花费数小时来阅读它,那么并行性可能会有所帮助。这是使其工作的最简单方法。调整并行度可能很困难,但如果你很幸运并且一切都配置合理,那么只需添加关键字 parallel 就可以了。

--Create index in parallel.
create index myTable_idx_myColumn on myTable(myColumn) parallel nologging;
--Reset it to NOPARALLEL after it's done.
alter index myTable_idx_myColumn noparallel;

【讨论】:

  • 非常感谢您的回复!第一次操作的结果是该表大约有 9.5GB。但是,我无法执行第二部分,因为 dbms_sqltune.report_sql_monitor 无法从 dbVisualizer 工作(ORA-00904:“DBMS_SQLTUNE”。“REPORT_SQL_MONITOR”:无效标识符),并且我无法直接访问服务器,但我们的 DBA 说他可以在下周进行调查。我会尽量为其他有类似问题的人提供最新信息。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2020-06-02
  • 1970-01-01
  • 2015-08-11
  • 2020-09-04
  • 2011-10-23
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多