MySQL 数据库规范--设计篇

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 目录1.设计阶段2.开发阶段3.调优阶段(未开发,pt_query_digest、show_slow_log、查询优化等)4.福利彩蛋1.设计阶段1.1 数据库表的设计范式(三范式&反范式)为什么需要范式优点:编程相对简单,数据量更小,更适合放入内存,更新更快,只需要更新少量的数据,更少的冗余意味着更少的需要group distinct 之类的操作。

目录


1.设计阶段
2.开发阶段
3.调优阶段(未开发,pt_query_digest、show_slow_log、查询优化等)
4.福利彩蛋

1.设计阶段

1.1 数据库表的设计范式(三范式&反范式)


为什么需要范式

优点:编程相对简单,数据量更小,更适合放入内存,更新更快,只需要更新少量的数据,
更少的冗余意味着更少的需要group distinct 之类的操作。

第一范式

数据表每一列都是不可分割的基本数据项。举例一个人有多个手机号

第二范式

数据表里的所有数据都要和该数据表里的主键有完全相依赖的关系,不能只依赖部分。
举例:用户名&用户技能 是主键,用户居住地 ,那么用户名为主键就可以了。

第三范式

缺点:非键属性都只和候选属性相关,非间属性之间没有关系。举例冠军表中冠军名&冠军生日。

范式的缺陷

查询变得相当复杂,查询时需要更多的连接join ,一些复合索引的列由于范式化的需要被分割到不同的表中,导致索引策略不佳。

反范式

优点:减少了连接,可以更好的利用索引进行筛选和排序,对查询操作可以提高性能。
缺点:要在数据一致性与查询之间找到平衡点,符合业务场景的设计才是好的设计

数据库设计准则

设计的数据库应该按照用户可能的访问路径,访问习惯进行设计,而不是严格按照数据范式来设计

1.2 存储引擎的选择


存储引擎分类
InnoDB:

1.灾难恢复性好
2.支持4中级别的事务,默认事务的隔离级别是Repeatable Read,事务支持是通过MVCC多版本并发控制来提供的。
3.使用行级锁,并发性能高。
4.使用此存储引擎的表,数据的物理组织形式是簇表,数据按主键来组织,即主键索引和数据是在一起的,B+树就是这样的
5.实现缓冲管理,能缓存索引也能缓存数据。
6.支持外键
7.支持热备份

MyISAM:

1.配合锁,实现操作系统下的复制备份,迁移
2.使用表记锁并发性差
3.支持全文索引
4.主机宕机后,表容易损坏,灾难恢复性不佳
5.无事务支持
6.只缓存索引,数据缓存利用操作系统缓冲区实现的,引发过多系统调用,性能不佳。
7.数据紧凑存储,可以获得更快的索引和更快的全表扫描性能。

存储引擎的选择:

设计阶段我们选用InnoDB存储引擎作为数据的存储模式,使用事务、且并发性高,支持外键,支持外键索引。

1.3 字符集选择


字符编码采用utf-8
字符校验采用utf-8-cgi

1.4 命名约定


规范的必要性P187

1.年前bug就是因为没有建立索引导致的一系列Bug,所以建立规范,刻不容缓。
2.命名没有强制约定,但在一个应用中建议风格统一。

命名约定

1.命名有意义,一眼知道这张表是干什么用的
2.数据库,表都用小写
   数据库形如:backend
   数据表形如:client_device_info(客户端设备信息),不要缩写,字母全小写
3.索引命名以idx_为前缀
4.命名不要过长(应尽量少于25字符)
5.不要使用保留字
6.同一字段在不同的表中也应是相同的类型和长度
7.同一数据库下有不同的模块,可以考虑对表名用不同的前缀标识
8.备份表时加上时间标识

1.5 索引设计


直接参考MySQL 数据库索引使用场景&注意事项

1.6 数据表设计与规划


表设计

1.如果没有特殊情况,建议选择InooDB索引
2.每个表都应该有主键,可选择自增字段,或整型字段。例外情况,一些应用会频繁的基于某些字段进行检索,设计人员可能认为这些字段/
  字组合更适合做主键,因为更自然、更高效。
3.(不做强制要求)尽量将字段设置为NOT NULL。因为NULL值的存储需要额外的空间,且会导致比较运算更为复杂,会使得优化器更难以
  优化sql。null 值虽然会导致比较运算更加复杂,但这比因此定义了not null带来应用逻辑异要好。
4.使用更短小的列,比如整型列。整型列的执行速度往往更快。
5.存储精确浮点数必须使用DECIMAL代替float和double。
6.建议使用unsigned类型存储非负值
7.建议使用 int unsigned存储ipv4
8.整型定义中不添加显示长度的值,使用int,而不是int(4)
9.尽可能不要使用text,blob类型
10.varchar(n) n表示字符数而不是字节数,比如varchar(255)最大可存储255个汉字,需根据实际字符长度选择n的值。
11.字符集建议选择utf-8
12.存储年时使用year类型
13.存储日期时使用date类型
14.存储时间时,建议使用timestamp类型,因为timestamp使用的是4字节,datetime使用的是8字节。
15.不要在数据库中使用varbinary或blob存储图片及文件,mysql 并不适合大量存储这类型文件
16.join 操作的字段,在不同表中的类型及命名要一致
17.如果更改表结构会影响性能,需要我司后台(有DBA尽可能找DBA)进行联合评审。

数据表规划

 查看数据表大小的脚本
 select sum(data_length+index_length) from information_schema.tables where table_schema = ‘app_backend’ and table_name = ‘client_device_info’;
其中data_length是记录大总大小,index_length 为索引的大小,table_schema 是数据库名
table_name 是数据表名。

1.7 慎用外键


外键的使用

1.外键的优点:
外键约束使得程序员更不容易将不一致性引入数据库,而且设计合适外键有助于以文档方式记录表间关系。
2.外键的缺点
但这些优点是以服务器为执行必要的检查而花费额外的开销为代价的。服务器进行额外的检查会影响性能。
其次外键对并发性能的影响很大,因每次修改数据都需要去另外一个表检查数据,需要获取额外的锁(以确保事务完成之前,父表的记录不
会被删除)高并发环境下出现性能问题,更好的办法是在应用层实现外键约束。

4.福利彩蛋

职位:腾讯OMG 广告后台高级开发工程师;
Base:深圳;
场景:海量数据,To B,To C,场景极具挑战性。
基础要求:
熟悉常用数据结构与算法;
熟悉常用网络协议,熟悉网络编程;
熟悉操作系统,有线上排查问题经验;
熟悉MySQL,oracle;
熟悉JAVA,GoLang,c++其中一种语言均可;
可内推,欢迎各位优秀开发道友私信[微笑]
期待关注我的开发小哥哥,小姐姐们私信我,机会很好,平台对标抖音,广告生态平台,类似Facebook 广告平台,希望你们用简历砸我~
联系方式 微信 13609184526

博客搬家:大坤的个人博客
欢迎评论哦~

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
11天前
|
弹性计算 关系型数据库 数据库
手把手带你从自建 MySQL 迁移到云数据库,一步就能脱胎换骨
阿里云瑶池数据库来开课啦!自建数据库迁移至云数据库 RDS原来只要一步操作就能搞定!点击阅读原文完成实验就可获得一本日历哦~
|
12天前
|
人工智能 小程序 关系型数据库
【MySQL】黑悟空都掌握的技能,数据库隔离级别全攻略
本文以热门游戏《黑神话:悟空》为契机,深入浅出地解析了数据库事务的四种隔离级别:读未提交、读已提交、可重复读和串行化。通过具体示例,展示了不同隔离级别下的事务行为差异及可能遇到的问题,如脏读、不可重复读和幻读等。此外,还介绍了在MySQL中设置隔离级别的方法,包括全局和会话级别的调整,并通过实操演示了各隔离级别下的具体效果。本文旨在帮助开发者更好地理解和运用事务隔离级别,以提升数据库应用的一致性和性能。
78 2
【MySQL】黑悟空都掌握的技能,数据库隔离级别全攻略
|
14天前
|
SQL 关系型数据库 MySQL
【MySQL 慢查询秘籍】慢SQL无处遁形!实战指南:一步步教你揪出数据库性能杀手!
【8月更文挑战第24天】本文以教程形式深入探讨了MySQL慢SQL查询的分析与优化方法。首先介绍了如何配置MySQL以记录执行时间过长的SQL语句。接着,利用内置工具`mysqlslowlog`及第三方工具`pt-query-digest`对慢查询日志进行了详细分析。通过一个具体示例展示了可能导致性能瓶颈的查询,并提出了相应的优化策略,包括添加索引、缩小查询范围、使用`EXPLAIN`分析执行计划等。掌握这些技巧对于提升MySQL数据库性能具有重要意义。
46 1
|
7天前
|
前端开发 C# 设计模式
“深度剖析WPF开发中的设计模式应用:以MVVM为核心,手把手教你重构代码结构,实现软件工程的最佳实践与高效协作”
【8月更文挑战第31天】设计模式是在软件工程中解决常见问题的成熟方案。在WPF开发中,合理应用如MVC、MVVM及工厂模式等能显著提升代码质量和可维护性。本文通过具体案例,详细解析了这些模式的实际应用,特别是MVVM模式如何通过分离UI逻辑与业务逻辑,实现视图与模型的松耦合,从而优化代码结构并提高开发效率。通过示例代码展示了从模型定义、视图模型管理到视图展示的全过程,帮助读者更好地理解并应用这些模式。
19 0
|
7天前
|
SQL 数据采集 关系型数据库
|
7天前
|
数据库 关系型数据库 MySQL
惊!Hibernate与MySQL的绝密优化技巧大揭秘,让你的数据库飞起来!
【8月更文挑战第31天】在企业应用开发中,结合使用持久层框架Hibernate与数据库管理系统MySQL可显著提升数据库交互效率。本文探讨了多项优化策略,包括配置二级缓存、采用单向关联减少JOIN操作、优化HQL查询语句以及合理使用MySQL索引。通过具体示例,文章详细讲解了如何实施这些优化措施,以期为企业应用提供更高效稳定的数据支持。
14 0
|
7天前
|
SQL 关系型数据库 MySQL
SQL Server、MySQL、PostgreSQL:主流数据库SQL语法异同比较——深入探讨数据类型、分页查询、表创建与数据插入、函数和索引等关键语法差异,为跨数据库开发提供实用指导
【8月更文挑战第31天】SQL Server、MySQL和PostgreSQL是当今最流行的关系型数据库管理系统,均使用SQL作为查询语言,但在语法和功能实现上存在差异。本文将比较它们在数据类型、分页查询、创建和插入数据以及函数和索引等方面的异同,帮助开发者更好地理解和使用这些数据库。尽管它们共用SQL语言,但每个系统都有独特的语法规则,了解这些差异有助于提升开发效率和项目成功率。
63 0
|
16天前
|
SQL 关系型数据库 MySQL
【揭秘】MySQL binlog日志与GTID:如何让数据库备份恢复变得轻松简单?
【8月更文挑战第22天】MySQL的binlog日志记录数据变更,用于恢复、复制和点恢复;GTID为每笔事务分配唯一ID,简化复制和恢复流程。开启binlog和GTID后,可通过`mysqldump`进行逻辑备份,包含binlog位置信息,或用`xtrabackup`做物理备份。恢复时,使用`mysql`命令执行备份文件,或通过`innobackupex`恢复物理备份。GTID模式下的主从复制配置更简便。
69 2
|
15天前
|
关系型数据库 MySQL 数据库
RDS MySQL灾备服务协同解决方案构建问题之数据库备份数据的云上云下迁移如何解决
RDS MySQL灾备服务协同解决方案构建问题之数据库备份数据的云上云下迁移如何解决
|
17天前
|
数据可视化 关系型数据库 MySQL
Mysql8 如何在 Window11系统下完成跳过密钥校验、完成数据库密码的修改?
这篇文章介绍了如何在Windows 11系统下跳过MySQL 8的密钥校验,并通过命令行修改root用户的密码。
Mysql8 如何在 Window11系统下完成跳过密钥校验、完成数据库密码的修改?
下一篇
DDNS