[MySQL 源码] innodb如何创建二级索引

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

以下为分析问题时的随笔。写的很凌乱,仅做记录,以备后用。。。。。。

//////////////////////////////////////////////////////////////

ha_innobase::add_index是innodb创建索引的接口函数。

以下所有的讨论都是基于创建一个非聚集的二级索引。因此一些过程是被省略掉了。
1.获取数据词典信息
          indexed_table = dict_table_get(prebuilt->table->name, FALSE);
2.检查索引键是否可用
       error = innobase_check_index_keys(key_info, num_of_keys, prebuilt->table);
3.检查索引列长度
4.
a.创建一个trx对象用于操作innodb数据词典,并创建新的数据词典信息
如果是主键,加LOCK_X,否则加LOCK_S锁
b.加数据词典锁row_mysql_lock_data_dictionary(trx);
c.在ibdata的SYS_INDEXES中加载新的数据词典信息
d.trx_commit_for_mysql(trx); 提交刚刚创建的trx
e.row_mysql_unlock_data_dictionary(trx)
以上步骤完成了对ibdata数据词典内的更新,在 完成后释放锁,这时候,如果在后续的row_merge_build_indexes时crash掉。trx_rollback_active不会drop掉新索引。
5.
调用函数row_merge_build_indexes实际创建索引,我们的讨论主要集中于此。
row_merge_build_indexes会读取表的聚集索引记录,创建临时表来保存这些记录,并使用合并排序算法进行排序以创建索引
a.
首先初始化merge file相关的数据结构,并初始化
merge_files = mem_alloc(n_indexes * sizeof *merge_files);
block_size = 3 * sizeof *block;
block = os_mem_alloc_large(&block_size);
merge_files用于管理针对每个索引创建的临时文件。
block类型为row_merge_block_t,其定义如下:
typedef byte row_merge_block_t[1048576];
因此block_size的值为3* 1048576=3145728字节
b.
创建临时文件
调用row_merge_file_create函数来对该数据的每个成员初始化临时文件。
单独建立一个临时文件tmpfd = row_merge_file_create_low();
c.
调用函数row_merge_read_clustered_index,读取聚集索引记录
一次scan 聚集索引,但为每一个要创建的索引创建entry,并将其加入到每个索引的sort buffer中(row_merge_buf_add)。
当buffer中的记录足够多时,就调用row_merge_buf_sort进行排序,并写入磁盘(row_merge_buf_write &&row_merge_write).
每个buffer的最大tuple数为:
max_tuples = sizeof(row_merge_block_t)/ ut_max(1, dict_index_get_min_size(index));
d.
现在我们可以对上一步准备好的临时文件或buffer进行排序。
排序函数为:
error = row_merge_sort(trx, indexes[i], &merge_files[i],
       block, &tmpfd, table);
在row_merge_sort函数中,对刚刚产生的临时文件进行归并排序(row_merge)。
在5.5的MySQL中,这里存在一个Bug,归并排序存在问题(参阅MySQL官方 bug#54330上Jimmy yang的解释)
尽管Buglist中标注为已经fix,但事实上因为某些意外并没有merge到主干。Percona已经修复了这个问题( https://code.launchpad.net/~laurynas-biveinis/percona-server/bug54330/+merge/94510
e.
排序完成后,调用row_merge_insert_index_tuples插入索引数据
f.
清理工作,及更新统计信息(如果开启了expand_fast_index_creation)

 

 


相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
16天前
|
关系型数据库 MySQL 索引
mysql 分析5语句的优化--索引添加删除
mysql 分析5语句的优化--索引添加删除
12 0
|
22天前
|
存储 关系型数据库 MySQL
轻松入门MySQL:优化进销存管理,掌握MySQL索引,提升系统效率(11)
轻松入门MySQL:优化进销存管理,掌握MySQL索引,提升系统效率(11)
|
27天前
|
存储 自然语言处理 关系型数据库
ElasticSearch索引 和MySQL索引那个更高效实用那个更合适
ElasticSearch索引 和MySQL索引那个更高效实用那个更合适
38 0
|
27天前
|
SQL 存储 关系型数据库
MySQL not exists 真的不走索引么
MySQL not exists 真的不走索引么
24 0
|
1月前
|
SQL 存储 关系型数据库
对线面试官 - 如何理解MySQL的索引覆盖和索引下推
索引下推是MySQL 5.6引入的优化,允许部分WHERE条件在索引中处理,减少回表次数。例如,对于索引(zipcode, lastname, firstname),查询`WHERE zipcode='95054' AND lastname LIKE '%etrunia%'`时,索引下推先过滤zipcode,然后在索引中应用lastname条件,降低回表需求。索引下推可在EXPLAIN的`Using index condition`中看到。
对线面试官 - 如何理解MySQL的索引覆盖和索引下推
|
14天前
|
存储 关系型数据库 MySQL
MySQL引擎对决:深入解析MyISAM和InnoDB的区别
MySQL引擎对决:深入解析MyISAM和InnoDB的区别
29 0
|
16天前
|
SQL 缓存 关系型数据库
mysql性能优化-慢查询分析、优化索引和配置
mysql性能优化-慢查询分析、优化索引和配置
82 1
|
22天前
|
缓存 关系型数据库 MySQL
MySQL查询优化:提速查询效率的13大秘籍(合理使用索引合并、优化配置参数、使用分区优化性能、避免不必要的排序和group by操作)(下)
MySQL查询优化:提速查询效率的13大秘籍(合理使用索引合并、优化配置参数、使用分区优化性能、避免不必要的排序和group by操作)(下)
|
22天前
|
缓存 关系型数据库 MySQL
MySQL 查询优化:提速查询效率的13大秘籍(索引设计、查询优化、缓存策略、子查询优化以及定期表分析和优化)(中)
MySQL 查询优化:提速查询效率的13大秘籍(索引设计、查询优化、缓存策略、子查询优化以及定期表分析和优化)(中)
|
7天前
|
Java 关系型数据库 MySQL
一套java+ spring boot与vue+ mysql技术开发的UWB高精度工厂人员定位全套系统源码有应用案例
UWB (ULTRA WIDE BAND, UWB) 技术是一种无线载波通讯技术,它不采用正弦载波,而是利用纳秒级的非正弦波窄脉冲传输数据,因此其所占的频谱范围很宽。一套UWB精确定位系统,最高定位精度可达10cm,具有高精度,高动态,高容量,低功耗的应用。
一套java+ spring boot与vue+ mysql技术开发的UWB高精度工厂人员定位全套系统源码有应用案例