MySQL 索引事务

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MySQL 索引事务

20231111

回顾

1.聚合查询

2.联合查询(内连接,外连接,自连接)重点

3.子查询

4.合并查询(union):需要保证列数和类型得匹配

可以合并多个表,or只能连接表内

MySQL 索引事务

索引(index)更多翻译成下标

       目录

在数据库中进行条件查询也是要遍历表的

数据库是把数据存储在硬盘上的,此处的O(N),比平时的慢很多,因为平时是指内存

因此给数据库也引入索引来 提高查询的速度

索引的特点

1.加快查询的速度

2.索引自身也是一定的数据结构,也要占据存储空间

3.当我们进行新增删除修改的时候,也需要针对索引进行更新,有额外的开销

删除修改搭配条件语句

先条件查找[变快]

再修改[变慢]

在没有条件的时候或者不能使用索引的时候,速度肯定会变慢

索引适用的场景

1.存储空间比较充裕(索引对于空间要求不高)

2.查询较多,增加删除修改不多

读多写少的场景是很常见的

通过sql如何操作索引?

1.查看索引

show index from 表名

查看是否有索引,有几个索引

primary key和unique这两个约束都会自动生成索引

mysql中的primary key 和 unique 和 foreign key 都会默认生成索引

一个表的索引可以有多个,每个索引,都根据具体的列来展开的

2.创建索引

create index 索引名 on 表名(列名);

   这个创建操作也是比较危险的操作

   假设这个表是空着的或者数据比较少,无所谓

   但是如果本身有很多数据,此时创建索引操作,就会触发大量硬盘IO

3.删除索引

drop index 索引名 on 表名;

删除索引也是一个危险操作

在创建索引的时候,一定要在建表之初就规划好.

实际开发中已经用了很久的表相加索引,只能曲线救国

可以另外搞一个机器搭建数据库,把生产环境的数据表创建好加上索引,再导入数据,最后用新的机器代替旧的机器

这里导入数据是不影响生产环境正常的工作的(慢慢导)

索引底层的数据结构的实现

索引其实是通过额外的数据结构,对表里的数据进行组织

使用什么样的数据结构,和表占用的空间,都是有很大的影响的

ArrayList底层是数组可以进行随机访问,当使用随机访问进行读写时,速度比较快

查找使用时indexOf的方法,要遍历ArrayList

尾插,尾删比较快,头插/中间插入/删除 比较慢

随机访问!=查找

LinkedList

进行头插头删尾插尾删都是O(1)的复杂度

进行查找/中间位置的删除都是O(n)的操作

LinkedList 是否遍历过程更快?

错误的,因为链表访问下一个元素通过next引用,相比顺序表的++操作,多了一次访问内存的操作,++用寄存器会更快

是否更加节省内存呢?

不是,每个节点都要额外的内存存储指针域

使用LinkedList在中间位置插入,为啥是O(N)??

因为Java接口设计不好

LinkedList通过add进行插入

这里std::list就更合理一点

insert(值,迭代器)

迭代器

O(1)确定迭代器的位置算在其他代码上的,就是O(1)的复杂度

二叉搜索树,如果元素比较多,树的高度就很高,就会增加查询过程中的比较次数

数据库查询的时候,经常指定的条件不是按照相等来比较的

但是数据库经常有< > between and这样的范围查找,哈希表就无能为力了

这里只能比较相等

因此数据库的索引使用了B+树作为数据结构~~

要想理解B+树,先得了解B树

B树也叫B-树 是连字符,不是减号

B树是一个N叉搜索树

N叉搜索树就是在二叉搜索树进行了扩展~~

一个节点可能包含n个值,n个值就划分出了n+1个区间

同样高度的树,能表示的元素相比于二叉搜索树上就多了不少

通过b树来查询的时候,论比较次数,比二叉搜索树还要多

但是,这里的关键就在于同一个节点的这些key是一次硬盘io就读出来的

(总的比较次数增加了,硬盘io的次数就少了)

B+树

n个key不是划分成N+1个区间,而是N个区间

比如 8 15

只有小于8和8到15之间了,没有大于8的了

在叶子节点会用链表串起来

B+树的特点:

1.也是N叉搜索树,每个节点包含N个key,划分出N个区间

2.每个节点中,会存在一个'最大值',换成最小值也是一样

3.每个节点中的key都会在子树中重复出现

重复出现带来的好处就是所有的数据都包含在叶子结点这一层(数据全集)

4.把叶子结点使用链式结构相连

如果没有这个链式结构,就需要反复回溯,就很麻烦了

查询稳定

查询任何一个节点都是需要通过根节点查询到叶子结点

(B树有时候硬盘io多,有的时候少)

按照上述结构来存储的话,就只需要在叶子结点来存储数据行

其他的非叶子节点只存储key即可

而这个key占用空间是比较小的

100w个key才4MB

这个时候就可以在查询的时候只进行内存的比较,减少了硬盘IO的次数

数据库的事务

很多时候进行的多个操作,期望能够打包到一起,共同执行

原子性,    

一致性,

隔离性,

持久性

rollback 回滚 来保证这种原子性的

怎么恢复回去的???

数据库对于事务这里有特殊的机制(undo log + redo log)

记录之前的数据,进行的操作,

数据库中间挂了,重启之后就会查看日志,看看是否有进行了一半的事务,如果有就进行回滚

事务这个东西,虽然是让数据更靠谱了,但是也付出了效率的代价

原子性,一致性,隔离性,持久性

持久性:事务的任何修改,都是写入硬盘的

隔离性:多个事务并发执行的时候,可能带来一些问题,通过隔离性来对这问题进行权衡,看你是希望数据尽量准确还是速度快

并发是指一个服务器涉及多个客户端,多个客户端同时修改一个表,就会产生一个bug

1.脏读问题:

两个事务修改一个数据,避免读到错误的数据

加锁,写的时候不能读,写完并且提交事务之后才可以让别人读了

2.不可重复读

又修改了一下,重新提交 代码又变了

是写加锁前提下导致的问题

刚刚约定的是写的时候不能读,没说读的时候不能写

给读操作也加锁,读的时候也不能写

通过锁让并行程度又降低了

3.幻读问题

事务1,2

事务1:修改数据,提交

事务2:开始读数据

事务3:新增了一个其他的数据,此时事务2就可能出现,两次读取的结果集不一样

解决幻读问题:严格执行串行化,不再执行任何并发了

上述几个情况,是否真的算bug??

看情况,看要效率还是要数据的准确性

mysql在配置中,提供了隔离级别这样的选项,可以根据需求调整隔离级别

1.read uncommitted 读未提交,并行程度是最高的,也是最不靠谱的

2.read committed 读已提交,相当于给写操作加锁,隔离程度提高了,效率低了一点,但是更靠谱

可能出现不可重复读和幻读问题

3.repeatable read   给读写操作加锁了

4.serializable     串行化,让所有事务都是串行执行........效率最低,数据更靠谱

什么时候,效率大于准确性??

点赞数.....当点击量达到10w+

关注的就是点击之后,快速响应就行,没必要那么精确

start transaction;

开启事务

sq1;

sq2;

sq3;

commit;事务完毕

rollback   告诉服务器要进行回滚,恢复回去  (一般不在控制台敲)

一般在java代码里,代码中控制开启事务,控制执行sql

结果某个sql抛出异常,在catch语句中,捕获到异常,并且使用rollback

上述内容,为了应对一般的面试题

JDBC编程

通过java代码来操作数据库

实际开发中,绝大多数情况,都是通过代码操作数据库的,调试,测试验证环境才会涉及到控制台

本质上还是操作sql

数据库是一个类别

1.mysql

2.oracle

3.sql server

4.sqlite

操作数数据库前提是数据库提供api

如果api特别多,也可以成为SDK(软件开发工具包)

原有的api不变,在这个基础上,加个封装层,适配到JDBC这一套接口上

后续学到操作数据库的框架本质上也是jdbc的封装

1.引入jdbc的驱动包

.class文件打包成.jar这样的压缩包

实际使用不用对jar进行解压缩,只要吧jar包导入即可

2随便创建一个目录,拷贝进去

JDBC方法有点多,注意步骤多练习

ip地址,用来描述一个主机在网络上的位置的机制每个同学电脑ip可能都是不同的此处统一写成127.0.0.1

loopback - 环回ip 表示本机

端口号:一个主机上,有很多服务器程序,使用端口号来区分不同的服务程序

高内聚,低耦合

耦合,两个东西之间的关联程度,关联程度越密,耦合越高

内聚:把有关系的代码放到一起,不要放到东一处西一处的

1.数据源 DataSourse

2.connection 先建立连接,才能进行通信 基于dataSourse才能建立连接

3.PreparedStatement 语句 基于连接来生成的,语句对象也是要发给服务器的

update只需要返回一个整数

Query返回的是一个ResultSet (结果集)

结果集指的就是select语句得到的临时表

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
8天前
|
存储 关系型数据库 MySQL
阿里面试:为什么要索引?什么是MySQL索引?底层结构是什么?
尼恩是一位资深架构师,他在自己的读者交流群中分享了关于MySQL索引的重要知识点。索引是帮助MySQL高效获取数据的数据结构,主要作用包括显著提升查询速度、降低磁盘I/O次数、优化排序与分组操作以及提升复杂查询的性能。MySQL支持多种索引类型,如主键索引、唯一索引、普通索引、全文索引和空间数据索引。索引的底层数据结构主要是B+树,它能够有效支持范围查询和顺序遍历,同时保持高效的插入、删除和查找性能。尼恩还强调了索引的优缺点,并提供了多个面试题及其解答,帮助读者在面试中脱颖而出。相关资料可在公众号【技术自由圈】获取。
|
25天前
|
存储 NoSQL 关系型数据库
为什么MySQL不使用红黑树做索引
本文详细探讨了MySQL索引机制,解释了为何添加索引能提升查询效率。索引如同数据库的“目录”,在数据量庞大时提高查询速度。文中介绍了常见索引数据结构:哈希表、有序数组和搜索树(包括二叉树、平衡二叉树、红黑树、B-树和B+树)。重点分析了B+树在MyISAM和InnoDB引擎中的应用,并讨论了聚簇索引、非聚簇索引、联合索引及最左前缀原则。最后,还介绍了LSM-Tree在高频写入场景下的优势。通过对比多种数据结构,帮助理解不同场景下的索引选择。
60 6
|
22天前
|
SQL 关系型数据库 MySQL
案例剖析:MySQL唯一索引并发插入导致死锁!
案例剖析:MySQL唯一索引并发插入导致死锁!
案例剖析:MySQL唯一索引并发插入导致死锁!
|
9天前
|
存储 SQL 关系型数据库
MySQL的事务隔离级别
【10月更文挑战第17天】MySQL的事务隔离级别
84 43
|
16天前
|
存储 关系型数据库 MySQL
Mysql(4)—数据库索引
数据库索引是用于提高数据检索效率的数据结构,类似于书籍中的索引。它允许用户快速找到数据,而无需扫描整个表。MySQL中的索引可以显著提升查询速度,使数据库操作更加高效。索引的发展经历了从无索引、简单索引到B-树、哈希索引、位图索引、全文索引等多个阶段。
50 3
Mysql(4)—数据库索引
|
22天前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1585 14
|
10天前
|
存储 关系型数据库 MySQL
如何在MySQL中进行索引的创建和管理?
【10月更文挑战第16天】如何在MySQL中进行索引的创建和管理?
32 1
|
14天前
|
SQL 关系型数据库 MySQL
阿里面试:MYSQL 事务ACID,底层原理是什么? 具体是如何实现的?
尼恩,一位40岁的资深架构师,通过其丰富的经验和深厚的技術功底,为众多读者提供了宝贵的面试指导和技术分享。在他的读者交流群中,许多小伙伴获得了来自一线互联网企业的面试机会,并成功应对了诸如事务ACID特性实现、MVCC等相关面试题。尼恩特别整理了这些常见面试题的系统化解答,形成了《MVCC 学习圣经:一次穿透MYSQL MVCC》PDF文档,旨在帮助大家在面试中展示出扎实的技术功底,提高面试成功率。此外,他还编写了《尼恩Java面试宝典》等资料,涵盖了大量面试题和答案,帮助读者全面提升技术面试的表现。这些资料不仅内容详实,而且持续更新,是求职者备战技术面试的宝贵资源。
阿里面试:MYSQL 事务ACID,底层原理是什么? 具体是如何实现的?
|
25天前
|
监控 关系型数据库 MySQL
MySQL数据表索引命名规范
MySQL数据表索引命名规范
30 1
|
25天前
|
存储 SQL 关系型数据库
mysql中主键索引和联合索引的原理与区别
本文详细介绍了MySQL中的主键索引和联合索引原理及其区别。主键索引按主键值排序,叶节点仅存储数据区,而索引页则存储索引和指向数据域的指针。联合索引由多个字段组成,遵循最左前缀原则,可提高查询效率。文章还探讨了索引扫描原理、索引失效情况及设计原则,并对比了InnoDB与MyISAM存储引擎中聚簇索引和非聚簇索引的特点。对于优化MySQL性能具有参考价值。