Mysql(一)Schema 数据类型优化 和索引基础

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 前言文本已收录至我的GitHub仓库,欢迎Star:github.com/bin39232820…种一棵树最好的时间是十年前,其次是现在

絮叨


为啥要讲Mysql呢?因为这个在面试也问得比较多,而且自己很多时候写代码用到mysql的时候,也没有太过于注意一些东西,然后我想着把mysql的东西 好好整理一下,哈哈。然后慢慢来吧,从最基础的开始,这个系列也是不停止系列。写到哪算到哪 博主从学了mysql之后一直没有系统的学习过mysql 这次为了啃他 准备了

  • 掘金小册的  从根儿上理解mysql


说实话这个确实很牛逼,基本上看第一遍的时候我都特么觉得完全看不懂,看第二遍才能稍微明白,这种文章适合反复看,像我这个小白,唉,只能说菜的扣脚。

  • mysql 45讲


难度比上面的小点。

  • 高性能mysql


技术总监点名要学习的,还不错。


  • 深入浅出mysql


其实我写博客,也就是记录自己的学习过程,其实我是觉得自己还是很菜的,在技术的路上 还处在 看山是山 的境界吗,希望2年后看到自己写的文章,心里会冒出一句,这是哪个shabi写的东西,哈哈,这说明,我这2年当中有进步嘛,好啦,大家一起来跟我系统的学习学习mysql吧。

后续文章默认大家会简单的crud,并且会用SQL语言,如果你连SELECT、INSERT这些单词都没听说过。那你得去学学基础了。(当然写博客的时候,博主也是这个水平的,所以我写出来的文章可能水平不高,但是肯定真实,因为我和大家一样是慢慢学得)

Schema 和 数据类型优化


良好的逻辑设计和物理设计是高性能的基石,应该根据系统将要执行的查询语句设计schema,这个需要自己好好权衡利弊。例如,反范式可以加快查询速度,但是同时也会使另外1一些查询变慢。所以下面就介绍一些实用的经验,数据库类型的优化。

  • 设计正确存储数据的最小数据类型,更小的数据通常更快,因为它们占用更少的磁盘,内存。和CPU
  • 尽量避免NULL,通常情况下最好指定为NOT NULL,除非真的需要存储NULL。因为可为NUll的列需要更多的存储空间,在记录索引的时候,可为NUll的列需要多一个字节(后面文章会细细道来)
  • 对于时间类型的选择 DATETIME 和TIMESTAMP它们都可以存储相同的时间类型,但是TIMESTAMP只使用DATETIME一半的存储空间。所以尽量选择TIMESTAMP (并且它的默认值是不为NULL)
  • char 和varchar 这个得看自己业务需求了,如果你确定你得字段的大小是百分之一百的,那你肯定是用char,如果不确定你就得用varchar 并且就是预估自己这个类型的长度。
  • 对于bit 是不建议用的,比如说我们业务中需要标识是否删除,是否上架这种类型的(只有2种情况的,也是建议使用tinyint来标识。
  • 尽量使用相同的数据类型存储相似或者相关的值,尤其是要在关联查询中使用的列
  • 小心使用ENUM,虽然他们很好用。但是不要滥用。
  • 尽量做到避免过度设计,例如会导致及其复杂的查询schema设计,或者有很多列的表设计。

范式是好的,但是反范式有时也是必须的,做过微服务开发的都知道,有时候我们冗余一些字段,可以为我们的业务带来更快的查询,但是我们更新的时候,就必须要多维护多一张表,所以对于我们读多写少的场景,我觉得冗余多一个字段也是没有问题的。对于范式和反范式的混用,得看具体的业务,仁者见仁,智者见智。经过大家多年来的实践经验得来的才是最真实的


索引基础


什么是索引

在关系数据库中,索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构,它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。

Tips

最近在做sql优化,其实sql我们做sql优化的时候第一步想到肯定是加索引,比如某一个 SQL 查询比较

慢,分析完原因之后,你可能就会说“给某个字段加个索引吧”之类的解决方案。但到底什么是 索引,索引又是如何工作的呢?


常见的索引类型

索引的出现是为了提高查询效率,但是实现索引的方式却有很多种,所以这里也就引入了索引模 型的概念。可以用于提高读写效率的数据结构很多,这里我先给你介绍三种常见、也比较简单的 数据结构,它们分别是哈希表、有序数组和搜索树。


哈希表

其实这个可以直接对比Java的HashMap,还算是比较简单 底层实现可以是数组+链表的这种数据结构,哈希的思路很简单,把值放在数组里,用一个哈希函数把 key 换 算成一个确定的位置,然后把 value 放在数组的这个位置。 不可避免地,多个 key 值经过哈希函数的换算,会出现同一个值的情况。处理这种情况的一种 方法是,拉出一个链表。

哈希表的特点就是可以快速的精确查询,但是不支持范围查询。它适用于等值查询的地方


有序数组

有序数组在等值查询和范围查询场景中的性能就都非常优秀 ,但是不合适更新,因为更新的时候就非常的耗费时间了,所以这种数据结构只能适合静态数据,你比如你大学四楼泡的妹子。哈哈已经这个是永远也不会改变的。有就是有,没有就算没有。。。


搜索树

搜索数结构,还算蛮多的

  • 二叉数
  • 它的话,搜索效率还是不错的,但是他的时间复杂度是O(log(N)),为了维持这个时间复杂度,更新的时间复杂度也得是O(log(N)),那就得保持这棵树是完全平衡二叉树了。
  • 平衡二叉树
  • 这个也是一样的,它的树高会很高,所以也不是那么适合做mysql的存储结构
  • B数
  • B树中的一个节点可以存储多个元素。
  • B+数
  • B+树是B树的升级版,只是把非叶子节点冗余一下,这么做的好处是为了提高范围查找的效率。

N 叉树由于在读写上的性能优点,以及适配磁盘的访问模式,已经被广泛应用在数据库引擎中了。数据库底层存储的核心就是基于这些数据模型的。每碰到一个新数据库,我们需要先关注它的数据模型,这样才能从理论上分析出这个数据库的适用场景。 对于数据结构和算法这门课,到时候我肯定也得过一下的这些才是软件工程的基础嘛。这里就不一一细说了。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
29天前
|
SQL 关系型数据库 MySQL
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
148 9
|
12天前
|
SQL 存储 关系型数据库
MySQL秘籍之索引与查询优化实战指南
最左前缀原则。不冗余原则。最大选择性原则。所谓前缀索引,说白了就是对文本的前几个字符建立索引(具体是几个字符在建立索引时去指定),比如以产品名称的前 10 位来建索引,这样建立起来的索引更小,查询效率更快!
71 22
 MySQL秘籍之索引与查询优化实战指南
|
9天前
|
SQL 关系型数据库 MySQL
MySQL派生表合并优化的原理和实现
通过本文的详细介绍,希望能帮助您理解和实现MySQL中派生表合并优化,提高数据库查询性能。
41 16
|
10天前
|
SQL 关系型数据库 MySQL
MySQL派生表合并优化的原理和实现
通过本文的详细介绍,希望能帮助您理解和实现MySQL中派生表合并优化,提高数据库查询性能。
27 7
|
14天前
|
存储 关系型数据库 MySQL
MySQL中为什么要使用索引合并(Index Merge)?
通过这些内容的详细介绍和实际案例分析,希望能帮助您深入理解索引合并及其在MySQL中的
60 10
|
26天前
|
存储 Oracle 关系型数据库
索引在手,查询无忧:MySQL索引简介
MySQL 是一款广泛使用的关系型数据库管理系统,在2024年5月的DB-Engines排名中得分1084,仅次于Oracle。本文介绍MySQL索引的工作原理和类型,包括B+Tree、Hash、Full-text索引,以及主键、唯一、普通索引等,帮助开发者优化查询性能。索引类似于图书馆的分类系统,能快速定位数据行,极大提高检索效率。
55 8
|
21天前
|
存储 关系型数据库 MySQL
【MYSQL】 ——索引(B树B+树)、设计栈
索引的特点,使用场景,操作,底层结构,B树B+树,MYSQL设计栈
|
24天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
53 3
|
24天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
59 3
|
24天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
74 2