MySQL第五章、索引事务

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有各自的数据结构实现。

 目录

一、索引

1.1 概念

1.2 作用

1.3 使用场景

1.4 使用

1.5 案例

二、索引背后的数据结构

2.1 B-树(B树)

2.2 B+树(MySQL背后数据结构)

三、事务

3.1 为什么使用事务

3.2 事务的概念

3.3 使用

3.4并发执行事务产生的问题

3.4.1脏读问题

3.4.2不可重复读

3.4.3幻读

3.4.4隔离级别


一、索引

1.1 概念

索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有各自的数据结构实现。

1.2 作用

    • 数据库中的表、数据、索引之间的关系,类似于书架上的图书、书籍内容和书籍目录的关系。
    • 索引所起的作用类似书籍目录,可用于快速定位、检索数据。
    • 索引对于提高数据库的性能有很大的帮助。

    image.gif编辑

    1.3 使用场景

    要考虑对数据库表的某列或某几列创建索引,需要考虑以下几点:

      • 数据量较大,且经常对这些列进行条件查询。
      • 该数据库表的插入操作,及对这些列的修改操作频率较低。
      • 索引会占用额外的磁盘空间。

      满足以上条件时,考虑对表中的这些字段创建索引,以提高查询效率。反之,如果非条件查询列,或经常做插入、修改操作,或磁盘空间不足时,不考虑创建索引。

      1.4 使用

      创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建对应列的索引。

        • 查看索引
        show index from 表名;

        image.gif

          • 创建索引

          对于非主键、非唯一约束、非外键的字段,可以创建普通索引

          create index 索引名 on 表名(字段名);

          image.gif

            • 删除索引
            drop index 索引名 on 表名;

            image.gif

            1.5 案例

            -- 创建用户表
            DROP TABLE IF EXISTS test_user;
            CREATE TABLE test_user (
                id_number INT,
                name VARCHAR(20) comment '姓名',
                age INT comment '年龄',
                create_time timestamp comment '创建日期'
            );

            image.gif

            -- 构建一个8000000条记录的数据
            -- 构建的海量表数据需要有差异性,所以使用存储过程来创建, 拷贝下面代码就可以了,暂时不用理解
            -- 产生名字
            drop function if exists rand_name;
            delimiter $$
            create function rand_name(n INT, l INT)
            returns varchar(255)
            begin
                declare return_str varchar(255) default '';
                declare i int default 0;
                    while i < n do
                        if i=0 then
                            set return_str = rand_string(l);
                        else
                            set return_str =concat(return_str,concat(' ', rand_string(l)));
                        end if;
                        set i = i + 1;
                        end while;
                        return return_str;
                        end $$
                        delimiter ;
            -- 产生随机字符串
            drop function if exists rand_string;
            delimiter $$
            create function rand_string(n INT)
            returns varchar(255)
            begin
            declare lower_str varchar(100) default
            'abcdefghijklmnopqrstuvwxyz';
            declare upper_str varchar(100) default
            'ABCDEFJHIJKLMNOPQRSTUVWXYZ';
            declare return_str varchar(255) default '';
            declare i int default 0;
            declare tmp int default 5+rand_num(n);
            while i < tmp do
            if i=0 then
            set return_str
            =concat(return_str,substring(upper_str,floor(1+rand()*26),1));
            else
            set return_str
            =concat(return_str,substring(lower_str,floor(1+rand()*26),1));
            end if;
            set i = i + 1;
            end while;
            return return_str;
            end $$
            delimiter ;
            -- 产生随机数字
            drop function if exists rand_num;
            delimiter $$
            create function rand_num(n int)
            returns int(5)
            begin
            declare i int default 0;
            set i = floor(rand()*n);
            return i;
            end $$
            delimiter ;
            -- 向用户表批量添加数据
            drop procedure if exists insert_user;
            delimiter $$
            create procedure insert_user(in start int(10),in max_num int(10))
            begin
            declare i int default 0;
            set autocommit = 0;
            repeat
            set i = i + 1;
            insert into test_user values ((start+i) ,rand_name(2,
            5),rand_num(120),CURRENT_TIMESTAMP);
            until i = max_num
            end repeat;
            commit;
            end $$
            delimiter ;
            -- 执行存储过程,添加8000000条用户记录
            call insert_user(1, 8000000);

            image.gif

            查询 id_number 为778899的用户信息:

            -- 可以看到耗时4.93秒,这还是在本机一个人来操作,在实际项目中,如果放在公网中,假如同时有1000
            个人并发查询,那很可能就死机。
            select * from test_user where id_number=556677;

            image.gif

            image.gif编辑

            可以使用explain来进行查看SQL的执行:

            explain select * from test_user where id_number=556677;
            *************************** 1. row ***************************
            id: 1
            select_type: SIMPLE
            table: test_user
            type: ALL
            possible_keys: NULL
            key: NULL <== key为null表示没有用到索引
            key_len: NULL
            ref: NULL
            rows: 6
            Extra: Using where
            1 row in set (0.00 sec)

            image.gif

            为提供查询速度,创建 id_number 字段的索引:

            create index idx_test_user_id_number on test_user(id_number);

            image.gif

            换一个身份证号查询,并比较执行时间:

            select * from test_user where id_number=776655;

            image.gif

            image.gif编辑

            可以使用explain来进行查看SQL的执行:

            explain select * from test_user where id_number=776655;
            *************************** 1. row ***************************
            id: 1
            select_type: SIMPLE
            table: test_user
            type: ref
            possible_keys: idx_test_user_id_number
            key: idx_test_user_id_number <= key用到了idx_test_user_id_number
            key_len: NULL
            ref: const
            rows: 1
            Extra: Using where
            1 row in set (0.00 sec)

            image.gif

            索引保存的数据结构主要为B+树,及hash的方式,实现原理会在以后数据库原理的部分讲解。


            二、索引背后的数据结构

            2.1 B-树(B树)

            image.gif编辑


            2.2 B+树(MySQL背后数据结构)

            image.gif编辑

            image.gif编辑


            三、事务

            3.1 为什么使用事务

            image.gif编辑image.gif编辑

            准备测试表:

            drop table if exists accout;
            create table accout(
                id int primary key auto_increment,
                name varchar(20) comment '账户名称',
                money decimal(11,2) comment '金额'
            );
            insert into accout(name, money) values
            ('阿里巴巴', 5000),
            ('四十大盗', 1000);

            image.gif

            比如说,四十大盗把从阿里巴巴的账户上偷盗了2000元

            -- 阿里巴巴账户减少2000
            update accout set money=money-2000 where name = '阿里巴巴';
            -- 四十大盗账户增加2000
            update accout set money=money+2000 where name = '四十大盗';

            image.gif

            假如在执行以上第一句SQL时,出现网络错误,或是数据库挂掉了,阿里巴巴的账户会减少2000,但是四十大盗的账户上就没有了增加的金额。

            解决方案:使用事务来控制,保证以上两句SQL要么全部执行成功,要么全部执行失败。

            3.2 事务的概念

            事务指逻辑上的一组操作,组成这组操作的各个单元,要么全部成功,要么全部失败。

            在不同的环境中,都可以有事务。对应在数据库中,就是数据库事务。

            3.3 使用

            (1)开启事务:start transaction;

            (2)执行多条SQL语句

            (3)回滚或提交:rollback/commit;

            说明:rollback即是全部失败,commit即是全部成功。

            start transaction;
            -- 阿里巴巴账户减少2000
            update accout set money=money-2000 where name = '阿里巴巴';
            -- 四十大盗账户增加2000
            update accout set money=money+2000 where name = '四十大盗';
            commit;

            image.gif

            image.gif编辑

            事务的特性及设置,会在后续 数据库原理 部分进一步讲解。

            image.gif编辑

            3.4并发执行事务产生的问题

            3.4.1脏读问题

            image.gif编辑

            加锁操作:降低了并发程度(降低了效率),提高了隔离性(提高了数据的准确性)

            3.4.2不可重复读

            image.gif编辑

            读加锁操作:进一步降低事务的并发处理能力(处理效率也降低),提高了事务的隔离性(数据的准确性又提高了)

            3.4.3幻读

            image.gif编辑

            3.4.4隔离级别

            image.gif编辑

            相关实践学习
            如何在云端创建MySQL数据库
            开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
            全面了解阿里云能为你做什么
            阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
            目录
            相关文章
            |
            12天前
            |
            缓存 关系型数据库 MySQL
            MySQL索引策略与查询性能调优实战
            在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
            |
            2月前
            |
            存储 关系型数据库 MySQL
            阿里面试:为什么要索引?什么是MySQL索引?底层结构是什么?
            尼恩是一位资深架构师,他在自己的读者交流群中分享了关于MySQL索引的重要知识点。索引是帮助MySQL高效获取数据的数据结构,主要作用包括显著提升查询速度、降低磁盘I/O次数、优化排序与分组操作以及提升复杂查询的性能。MySQL支持多种索引类型,如主键索引、唯一索引、普通索引、全文索引和空间数据索引。索引的底层数据结构主要是B+树,它能够有效支持范围查询和顺序遍历,同时保持高效的插入、删除和查找性能。尼恩还强调了索引的优缺点,并提供了多个面试题及其解答,帮助读者在面试中脱颖而出。相关资料可在公众号【技术自由圈】获取。
            |
            2月前
            |
            存储 NoSQL 关系型数据库
            为什么MySQL不使用红黑树做索引
            本文详细探讨了MySQL索引机制,解释了为何添加索引能提升查询效率。索引如同数据库的“目录”,在数据量庞大时提高查询速度。文中介绍了常见索引数据结构:哈希表、有序数组和搜索树(包括二叉树、平衡二叉树、红黑树、B-树和B+树)。重点分析了B+树在MyISAM和InnoDB引擎中的应用,并讨论了聚簇索引、非聚簇索引、联合索引及最左前缀原则。最后,还介绍了LSM-Tree在高频写入场景下的优势。通过对比多种数据结构,帮助理解不同场景下的索引选择。
            88 6
            |
            2月前
            |
            SQL 关系型数据库 MySQL
            案例剖析:MySQL唯一索引并发插入导致死锁!
            案例剖析:MySQL唯一索引并发插入导致死锁!
            117 0
            案例剖析:MySQL唯一索引并发插入导致死锁!
            |
            2月前
            |
            存储 SQL 关系型数据库
            MySQL的事务隔离级别
            【10月更文挑战第17天】MySQL的事务隔离级别
            100 43
            |
            2月前
            |
            存储 关系型数据库 MySQL
            Mysql(4)—数据库索引
            数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
            64 3
            Mysql(4)—数据库索引
            |
            25天前
            |
            监控 关系型数据库 MySQL
            数据库优化:MySQL索引策略与查询性能调优实战
            【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
            135 1
            |
            2月前
            |
            存储 缓存 关系型数据库
            MySQL事务日志-Redo Log工作原理分析
            事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
            1648 14
            |
            2月前
            |
            存储 关系型数据库 MySQL
            如何在MySQL中进行索引的创建和管理?
            【10月更文挑战第16天】如何在MySQL中进行索引的创建和管理?
            70 1
            |
            2月前
            |
            SQL 关系型数据库 MySQL
            阿里面试:MYSQL 事务ACID,底层原理是什么? 具体是如何实现的?
            尼恩,一位40岁的资深架构师,通过其丰富的经验和深厚的技術功底,为众多读者提供了宝贵的面试指导和技术分享。在他的读者交流群中,许多小伙伴获得了来自一线互联网企业的面试机会,并成功应对了诸如事务ACID特性实现、MVCC等相关面试题。尼恩特别整理了这些常见面试题的系统化解答,形成了《MVCC 学习圣经:一次穿透MYSQL MVCC》PDF文档,旨在帮助大家在面试中展示出扎实的技术功底,提高面试成功率。此外,他还编写了《尼恩Java面试宝典》等资料,涵盖了大量面试题和答案,帮助读者全面提升技术面试的表现。这些资料不仅内容详实,而且持续更新,是求职者备战技术面试的宝贵资源。
            阿里面试:MYSQL 事务ACID,底层原理是什么? 具体是如何实现的?