如何加快建 index 索引 的时间

简介:

朋友在500w的表上建索引,半个小时都没有结束。所以就讨论如何提速。

 

一.先来看一下创建索引要做哪些操作:
1. 把index key的data 读到内存
==>如果data 没在db_cache 中,这时候很容易有大量的db file scatter read wait

2. 对index key的data 作排序
==>sort_area_size 或者pga_aggregate_target 不够大的情况下,需要做 disk sort, 会有大量的driect path read/write , 另外,消耗大量CPU Time

3. 创建新的index segment ,把排过序的index data 写到所创建的index segment 里面
==>如果index 很大,那么,有时也会有redo log 相关等待,如:
log buffer space ,log file sync , log file parallel write 等

所以,在建大表索引时,可以增大pga,增大temp tablepace,并且用nologging或并行选项。

如:
create index idx_logs on logs(time) nologging parallel 4;

 

并行度一般看CPU 个数。当然在CPU 比较空闲的情况下可以多并行几个。对于单CPU不建议用并行,这样反而会增加创建时间。也可以根据v$session_wait 的资料,做针对性的tuning , 这样可以降低点时间。

 

补充知识:

查看cpu 信息:more /proc/cpuinfo

查看内存信息:more /proc/meminfo

查看操作系统信息:more /etc/issue

有关索引概念性的东西,请参考我的Blog:

 

Oracle 索引 详解

http://blog.csdn.net/tianlesoftware/archive/2010/03/05/5347098.aspx

 

 

 

二. 测试

 

自己也测试了下。测试环境:Oracle 11g R2, win7 64bit ,CPU T6670 2.2G 双核, 内存:4G。

 

 

1. 查看表的数据量:

SQL> select count(*) from custaddr;

 

  COUNT(*)

----------

   7230464

 

2. 查看现有索引:

SQL> select index_name,index_type from user_indexes where table_name='CUSTADDR';

 

INDEX_NAME                     INDEX_TYPE

------------------------------ ---------------------------

PK_CUSTADDR_TP_723             NORMAL

IX_CUSTADDR_ADDRABB_TP         NORMAL

IX_CUSTADDR_TEAMID_TP          NORMAL

IX_CUSTADDR_CUSTID_TP          NORMAL

IX_CUSTADDR_COMPABB_TP         NORMAL

IX_CUSTADDR_AREACODE           NORMAL

IX_CUSTADDR_ADDR_TP            NORMAL

 

已选择7行。

3. 删除索引:IX_CUSTADDR_CUSTID_TP


SQL> drop index IX_CUSTADDR_CUSTID_TP ;

索引已删除。

4. 默认方式创建索引:


SQL> SET timing on;

SQL> CREATE INDEX  IX_CUSTADDR_CUSTID_TP ON CUSTADDR (CUSTID );

索引已创建。

已用时间:  00: 00: 48.37

单位:s

5. 用nologging 模式:
SQL> drop index IX_CUSTADDR_CUSTID_TP ;

索引已删除。

已用时间:  00: 00: 00.09
SQL> CREATE INDEX  IX_CUSTADDR_CUSTID_TP ON CUSTADDR (CUSTID )  NOLOGGING;

索引已创建。

已用时间:  00: 00: 34.46

 

6. Nologging+ parallel 模式

SQL> drop index IX_CUSTADDR_CUSTID_TP ;

索引已删除。

已用时间:  00: 00: 00.17

SQL> CREATE INDEX  IX_CUSTADDR_CUSTID_TP ON CUSTADDR (CUSTID )  NOLOGGING PARALLEL 2;

索引已创建。

已用时间:  00: 00: 52.56

SQL> drop index IX_CUSTADDR_CUSTID_TP ;

索引已删除。

已用时间:  00: 00: 00.07

SQL> CREATE INDEX  IX_CUSTADDR_CUSTID_TP ON CUSTADDR (CUSTID )  NOLOGGING PARALLEL 4;

索引已创建。

已用时间:  00: 00: 53.44

 

看来在单CPU上,并行效果还不好.

 

7. Parallel 模式

SQL> drop index IX_CUSTADDR_CUSTID_TP ;

索引已删除。

已用时间:  00: 00: 00.02

SQL> CREATE INDEX  IX_CUSTADDR_CUSTID_TP ON CUSTADDR (CUSTID ) PARALLEL 2;

索引已创建。

已用时间:  00: 00: 49.97

SQL> drop index IX_CUSTADDR_CUSTID_TP ;

索引已删除。

已用时间:  00: 00: 00.02

SQL> CREATE INDEX  IX_CUSTADDR_CUSTID_TP ON CUSTADDR (CUSTID ) PARALLEL 4;

索引已创建。

已用时间:  00: 00: 50.25

 

 

从上面的测试数据可以看出,700万的数据,建索引,也在1分钟以内。 但是并行在单CPU上效果不明显,而且比光使用NOLOGGING还要慢,因为出现资源争用了,可能是CPU的争用,也可能是I/O的争用。

 

转: http://blog.csdn.net/tianlesoftware/article/details/5664019

文章可以转载,必须以链接形式标明出处。


本文转自 张冲andy 博客园博客,原文链接: http://www.cnblogs.com/andy6/p/6726096.html   ,如需转载请自行联系原作者

相关文章
|
5月前
|
人工智能 Cloud Native Java
2025 年 Java 应届生斩获高薪需掌握的技术实操指南与实战要点解析
本指南为2025年Java应届生打造,涵盖JVM调优、响应式编程、云原生、微服务、实时计算与AI部署等前沿技术,结合电商、数据处理等真实场景,提供可落地的技术实操方案,助力掌握高薪开发技能。
292 2
|
存储 安全 算法
一文理解UDS安全访问服务(0x27)
一文理解UDS安全访问服务(0x27)
一文理解UDS安全访问服务(0x27)
|
8月前
|
人工智能 自然语言处理 IDE
通义灵码正式上线 Qwen3,编程智能体马上来了!
Qwen3正式发布并开源8款「混合推理模型」,包括两款MoE模型(Qwen3-235B-A22B、Qwen3-30B-A3B)和六个Dense模型。旗舰模型Qwen3-235B-A22B在多项测试中表现出色,竞争力强。Qwen3支持两种思考模式(思考与非思考),涵盖119种语言,增强Agent能力,在BFCL评测中创纪录。通义灵码已上线相关插件,助力开发者体验AI编码能力。
1327 11
|
10月前
|
人工智能 自然语言处理 API
解锁 DeepSeek API 接口:构建智能应用的技术密钥
在数字化时代,智能应用蓬勃发展,DeepSeek API 作为关键技术之一,提供了强大的自然语言处理能力。本文详细介绍 DeepSeek API,并通过 Python 请求示例帮助开发者快速上手。DeepSeek API 支持文本生成、问答系统、情感分析和文本分类等功能,具备高度灵活性和可扩展性,适用于多种场景。示例展示了如何使用 Python 调用 API 生成关于“人工智能在医疗领域的应用”的短文。供稿者:Taobaoapi2014。
|
机器学习/深度学习 存储 测试技术
从0到1:如何规划一套流量回放自动化测试方案
本文介绍了流量回放自动化测试的完整方法,从企业战略到交付的四个关键环节:Discovery(深度挖掘)、Define(定义目标)、Design(详细设计)和Delivery(交付与反馈)。通过这些步骤,帮助企业优化系统性能和稳定性,确保产品的高质量。
367 4
|
域名解析 缓存 负载均衡
【域名解析DNS专栏】DNS解析优化:减少延迟,提升用户体验
【5月更文挑战第24天】本文探讨了DNS解析优化策略,以减少延迟并提升用户体验。DNS解析涉及客户端查询、递归与迭代查询及返回结果。延迟可能源于服务器位置、负载、缓存策略和网络问题。优化措施包括使用高性能DNS服务、优化缓存、实施DNS负载均衡和预取技术。提供的HTML示例展示了DNS预取如何工作。通过评估、选择合适DNS服务、配置缓存、部署负载均衡及持续监控,可实现DNS优化,从而提高网站性能。
1192 0
【域名解析DNS专栏】DNS解析优化:减少延迟,提升用户体验
|
Linux 网络安全 数据安全/隐私保护
|
Linux
CentOS 7 下编译安装 4.14 内核
CentOS 7 下编译安装 4.14 内核
614 1
CentOS 7 下编译安装 4.14 内核
|
缓存 Linux
【阿里云镜像】切换阿里巴巴开源镜像站镜像——Fedora镜像
Fedora 是一个 Linux 发行版,是一款由全球社区爱好者构建的面向日常应用的快速、稳定、强大的操作系统。它允许任何人自由地使用、修改和重发布,目标是创建一套新颖、多功能并且自由的操作系统。
4198 0
【阿里云镜像】切换阿里巴巴开源镜像站镜像——Fedora镜像