MySQL 设计与查询规范

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 Tair(兼容Redis),内存型 2GB
简介: MySQL 设计与查询规范

背景

想象一下自己是一名伐木工人,手里有林场里最好的斧子,因此你是工作效率最高的。突然有一天场里来了个推销的,他把一种新的砍树工具——链锯——给夸到了天上去。你也买了一把,不过你不懂得怎么用。你估摸着按照自己原来擅长的砍树方法,把链锯大力地挥向树干……

MySQL 这个工具也是一样,设计规范就是的一个很好的工具说明。即统一了命名风格,又可以让新人快速上手。

本文的主要内容可以在网上找到类似的版本,但是在一些细节点又略微不同。基于多年 MySQL 使用经验,基于应用与 MySQL 的通盘考虑(视 MySQL 为低配版本的:Bigtable + KV),才有了这些细节上的调整。

命名

避免使用 MySQL 关键词 作为 db / table / field / index 名称

  • DB
  • 使用项目名作为前缀,“_db” 作为后缀;分库添加后缀8位宽度的数字,数字从0开始
  • 风格:由下划线分割的小写英文字母组成
  • DB 名称总长度小于 42 个字符
  • Table
  • “_db” 作为后缀;分表添加后缀8位宽度的数字,数字从0开始
  • 风格:由下划线分割的小写英文字母组成
  • 表名称总长度小于 48 个字符
  • Field
  • 主键统一定义为:id BIGINT UNSIGNED NOT NULL
  • 指向其他表主键的字段以 “_id” 后缀结尾
  • 风格:由下划线分割的小写英文字母组成
  • Index
  • 使用 “idx_” 作为前缀;索引字段名字、顺序组合为名称
  • 风格:由下划线分割的小写英文字母组成
  • Comment
  • 纯英文单词注释所有字段

DB

  • 使用 Innodb 存储引擎

Innodb 支持事务,支持行级锁,更好的恢复性,高并发下性能更好

  • 使用 utf8mb4_unicode_ci 编码

兼容性更好,统一字符集可以避免由于字符集转换产生的乱码,不同的字符集进行比较前需要进行转换会造成索引失效

Table

  • 使用 utf8mb4_unicode_ci 编码
  • 每张表必须显式定义主键
  1. 数据的存储顺序和主键的顺序是相同的
  2. 不要使用更新频繁的列作为主键,不要使用 UUID、MD5、HASH、字符串等无法保证数据的顺序增长的字段作为主键
  • 尽量控制单表数据量的大小,建议控制在 1000万 以内
  1. 该量级数据量查询性能较好
  2. 可以用历史数据归档,分库分表等手段来控制单表数据量
  • 宽表尽量拆分为索引表和内容表以提高查询性能
  1. MySQL 限制每个表最多存储 4096 列,并且每一行数据的大小不能超过 65535 字节 减少磁盘 IO,保证热数据的内存缓存命中率
  2. 表越宽,装载进内存缓冲池时所占用的内存也就越大,也会消耗更多的 IO,更有效的利用缓存,避免读入无用的冷数据
  • 谨慎使用 JOIN
  1. 应用层缓存效率更高,可以在多种查询场景复用缓存
  2. 在应用层做关联,可以更容易对数据库进行拆分,更容易做到高性能和可扩展
  3. 查询效率提升。使用 ID 查询,可以让 MySQL 按照主键索引顺序查询,相比关联要更稳定高效
  • 谨慎使用 MySQL 分区表

分区表在物理上表现为多个文件,在逻辑上表现为一个表 谨慎选择分区键,跨分区查询效率可能更低 建议采用物理分表的方式管理大数据

  • 不要使用外键
  1. MySQL 外键实现比较简单粗糙,性能不好
  2. MySQL 作为后端存储,不在 MySQL 上放置任何计算逻辑
  3. 如果依赖于在 MySQL 服务器上运行的计算逻辑,进行数据库/表分片将非常困难

Field

  • 优先选择符合存储需要的最小的数据类型

列的字段越大,索引时所需要的空间越大,磁盘单页存储的索引节点数越少,遍历时 IO 次数就越多, 索引性能也就越差

方法:

1)将字符串转换成数字类型存储,如:将IP地址转换成整形数据(inet_aton / inet_ntoa)

2)对于非负型的数据(如自增ID、整型IP)来说,要优先使用无符号整型来存储

  • 存储相同数据的列名和列类型必须一致

如果查询时关联列类型不一致会自动进行数据类型隐式转换,会造成列上的索引失效,导致查询效率降低

  • 尽可能把所有列定义为 NOT NULL
  • NULL 占用额外的空间来保存
  • NULL 需要特殊处理,可能会导致应用程序异常
  • NULL MySQL 索引统计和值比较更复杂
  • 避免使用 ENUM 类型
  • 修改 ENUM 值需要使用 ALTER 语句
  • ENUM 类型的 ORDER BY 操作效率低,需要额外操作
  • 禁止使用数值作为 ENUM 的枚举值
  • 禁止在数据库中存储长文本、图片,文件等大数据

MySQL 内存临时表不支持 TEXT、BLOB 大数据类型,如果查询中包含这样的数据,在排序等操作时,就不能使用内存临时表,必须使用磁盘临时表进行

而且对于这种数据,MySQL 还是要进行二次查询,会使 SQL 性能变得很差,但是不是说一定不能使用这样的数据类型

  • 禁止建立预留字段
  • 预留字段的命名很难做到见名识义
  • 预留字段无法确认存储的数据类型,所以无法选择合适的类型
  • 对预留字段类型的修改,会对表进行锁定

Index

  • 限制每张表上的索引数量,建议单张表索引不超过5个

MySQL 优化器优化查询时,会根据统计信息,对候选索引来进行评估,以生成出一个最好的执行计划,如果同时有很多个索引都可以用于查询,就会增加 MySQL 优化器生成执行计划的时间,同样会降低查询性能

Stored Programs

  • 禁止使用 mysql 视图,存储过程,触发器,自定义函数

Queries

  • 禁止直连生产环境,手工删除和修改生产数据
  • 禁止使用 SELECT * 必须使用 SELECT <字段列表> 查询

可减少表结构变更对应用程序的影响

  • 禁止使用不含字段列表的INSERT语句

正确:INSERT INTO tbl(c1,c2,c3) VALUES (a,b,c);

错误:INSERT INTO VALUES (a,b,c);

  • WHERE从句中禁止对列进行函数转换和计算

对列进行函数转换或计算时会导致无法使用索引。

正确:WHERE create_time >= 20190101 AND create_time < 20190102

错误:WHERE DATE(create_time)=20190101

  • 不会有重复值时使用 UNION ALL 而不是 UNION

UNION 将结果集的所有数据放到临时表后再去重

UNION ALL 不会再对结果集进行去重

参考链接:

https://www.cnblogs.com/huchong/p/10219318.html

本文作者 : cyningsun

本文地址https://www.cyningsun.com/06-06-2021/mysql-design-guide.html

版权声明 :本博客所有文章除特别声明外,均采用 CC BY-NC-ND 3.0 CN 许可协议。转载请注明出处!

# 数据库

  1. 深入理解 Redis cluster GOSSIP 协议
  2. 如何配置 go-redis 连接池
  3. 如何使用 Redis 存储对象
  4. Redis cluster 细节与技术选型
  5. etcd 实现与选型分析

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
缓存 关系型数据库 MySQL
MySQL索引策略与查询性能调优实战
在实际应用中,需要根据具体的业务需求和查询模式,综合运用索引策略和查询性能调优方法,不断地测试和优化,以提高MySQL数据库的查询性能。
196 66
|
13天前
|
存储 Oracle 关系型数据库
索引在手,查询无忧:MySQL索引简介
MySQL 是一款广泛使用的关系型数据库管理系统,在2024年5月的DB-Engines排名中得分1084,仅次于Oracle。本文介绍MySQL索引的工作原理和类型,包括B+Tree、Hash、Full-text索引,以及主键、唯一、普通索引等,帮助开发者优化查询性能。索引类似于图书馆的分类系统,能快速定位数据行,极大提高检索效率。
48 8
|
16天前
|
SQL 关系型数据库 MySQL
MySQL 窗口函数详解:分析性查询的强大工具
MySQL 窗口函数从 8.0 版本开始支持,提供了一种灵活的方式处理 SQL 查询中的数据。无需分组即可对行集进行分析,常用于计算排名、累计和、移动平均值等。基本语法包括 `function_name([arguments]) OVER ([PARTITION BY columns] [ORDER BY columns] [frame_clause])`,常见函数有 `ROW_NUMBER()`, `RANK()`, `DENSE_RANK()`, `SUM()`, `AVG()` 等。窗口框架定义了计算聚合值时应包含的行。适用于复杂数据操作和分析报告。
57 11
|
20天前
|
存储 关系型数据库 MySQL
mysql怎么查询longblob类型数据的大小
通过本文的介绍,希望您能深入理解如何查询MySQL中 `LONG BLOB`类型数据的大小,并结合优化技术提升查询性能,以满足实际业务需求。
74 6
|
2月前
|
SQL 前端开发 关系型数据库
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
SpringBoot使用mysql查询昨天、今天、过去一周、过去半年、过去一年数据
68 9
|
2月前
|
缓存 监控 关系型数据库
如何优化MySQL查询速度?
如何优化MySQL查询速度?【10月更文挑战第31天】
128 3
|
2月前
|
SQL NoSQL 关系型数据库
2024Mysql And Redis基础与进阶操作系列(5)作者——LJS[含MySQL DQL基本查询:select;简单、排序、分组、聚合、分组、分页等详解步骤及常见报错问题所对应的解决方法]
MySQL DQL基本查询:select;简单、排序、分组、聚合、分组、分页、INSERT INTO SELECT / FROM查询结合精例等详解步骤及常见报错问题所对应的解决方法
|
2月前
|
监控 关系型数据库 MySQL
数据库优化:MySQL索引策略与查询性能调优实战
【10月更文挑战第27天】本文深入探讨了MySQL的索引策略和查询性能调优技巧。通过介绍B-Tree索引、哈希索引和全文索引等不同类型,以及如何创建和维护索引,结合实战案例分析查询执行计划,帮助读者掌握提升查询性能的方法。定期优化索引和调整查询语句是提高数据库性能的关键。
342 1
|
3月前
|
SQL Java 关系型数据库
java连接mysql查询数据(基础版,无框架)
【10月更文挑战第12天】该示例展示了如何使用Java通过JDBC连接MySQL数据库并查询数据。首先在项目中引入`mysql-connector-java`依赖,然后通过`JdbcUtil`类中的`main`方法实现数据库连接、执行SQL查询及结果处理,最后关闭相关资源。
233 6
|
2月前
|
SQL 关系型数据库 MySQL
定时任务频繁插入数据导致锁表问题 -> 查询mysql进程
定时任务频繁插入数据导致锁表问题 -> 查询mysql进程
59 1