程序员晋级之路——mysql性能优化之数据库分区实战

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
云数据库 RDS PostgreSQL,高可用系列 2核4GB
简介: 程序员晋级之路——mysql性能优化之数据库分区实战

前言


笔者的上一个项目一切都在有条不紊的推进,直到通过了层层测试来到上线的那一天,实施小哥兴奋地挥舞着刚买到机票的手机,没想到真正的考验正在一步步逼近。

我们本次的项目是为了给我们的用户进行软件升级(因为种种历史原因,原软件代码已经无法维护),自带四百万账单数据,当数据入库完成的那一刻,大家全都安静了,账单结算根本跑不动!!!大量历史数据将查询更改操作无限拖慢,没有办法大家只能使用一些应急技巧,好歹让项目如期上线!

现在二期项目开始了,我们来一起探索这些项目优化点,首当其冲就是数据库!


分区or分表


最开始我们想要采用分表的方法来实现大数据量的问题,但是真正到实施的时候发现大家都没有分表的项目经验。我相信真正的分表项目一定有一套成熟完善的项目管理办法,可能比我们想象的要简单许多,无奈大家都没有大项目经验,只能退而求其次去了解一下分区。

经过了解之后我们发现这种历史数据的问题好像使用分区更加合理!


操作更加简单 ,项目该怎么管理就怎么管理,代码该怎么写还怎么写,不需要做一些很特殊的处理(其实当发现这一条有点的时候我们就决定了方案 ~ 。~);

热点数据相对集中,查询更加高效;

实施起来非常简单,一次实施永久拥有;

网上可以查到很多资料;

工作原理


分区是数据库将你需要存储的数据按照你选择的字段(这个字段是连贯的规律的,比如按时间正序排序的)将一张表中的数据存储到磁盘上的不同位置,形成一个个的数据区域,比如:2017年1月1日到2018年1月1日的所有账单数据存在一个区域内,2018年1月1日到2019年1月1日的所有数据存在一个区域内,当你的查询语句的条件中包含账单时间这个字段时,他会对每个区域开始的那条数据的账单时间和结束的那条数据的账单时间进行扫描,确定你所查询的数据在哪一个数据区域内,然后再去遍历这个这个数据区域,将符合条件的数据查询出来


具体实施


网上可以看到许多分区的资料,但是大多不够贴地气,看起来总是还要自己思考和实验(烦躁的一笔 ~ 。~),但是总结下来也就这么几个需要注意的点:

1.分区所选的字段必须是主键或者是混合主键的一部分,不然会报错:A PRIMARY KEY must include all columns in the table’s partitioning function

比如按时间进行分区操作,需要注意选择的时间要设置为第二主键,混合主键就就像下图这样:

image.png

在id和curtime一列的主键栏各点一下就 ok了!混合主键完成!!

那么为啥分区用的字段必须包含主键呢?

上文中我们提到数据库将一张表中的数据按照按照我们选择的字段将数据分割成一个个的数据区域,试想一下,如果id是我们的主键,我们是按照时间分区的,那么当我插入一条数据的时候数据库需要遍历所有的分区的所有的id去辨认我们新插入的id是否重复,这样无疑是低效的!~

2.分区需要的字段必须是int类型的,不然会报:Field ‘xxx’ is of a not allowed type for this type of partitioning。

在网上搜到的分区帖子,大部分都是使用时间去完成分区,可见使用时间分区是最合理的分区方案之一!

既然分区需要int类型那么date或者datetime类型的时间格式肯定需要处理一下子,这个地方可以使用TO_DAYS()方法将日期转换为从1970年1月1日到今天的天数,这个肯定是int类型无疑了。

接下来就是具体实施了:

1、首先在Navicat上建表,字段类型啥的自己定义就可以了

2、字段定义完成之后设置混合主键

3、右键你新建的表,如下

image.png

查看对象信息,点击ddl

image.png

查看表建立sql语句,在sql语句的最后加上

PARTITION BY RANGE (TO_DAYS(curtime) ) (
PARTITION p201712 VALUES LESS THAN (TO_DAYS('2018-01-01')),
PARTITION p201801 VALUES LESS THAN (TO_DAYS('2018-02-01'))
)

不要忘记将原来sql语句的;去掉!!!!

这样一个分区的数据库表就建立完成了。

手动新增mysql分区(注意只能在已有分区的表上新增):

ALTER TABLE record1 ADD PARTITION(
PARTITION p201902 VALUES LESS THAN (TO_DAYS('2019-03-01'))
);

查询是否建立分区成功:

select 
  partition_name part,  
  partition_expression expr,  
  partition_description descr,  
  table_rows  
from information_schema.partitions  where 
  table_schema = schema()  
  and table_name='record1';  --record1查询的表名
相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
23天前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
215 7
|
1月前
|
NoSQL 算法 Redis
【Docker】(3)学习Docker中 镜像与容器数据卷、映射关系!手把手带你安装 MySql主从同步 和 Redis三主三从集群!并且进行主从切换与扩容操作,还有分析 哈希分区 等知识点!
Union文件系统(UnionFS)是一种**分层、轻量级并且高性能的文件系统**,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a single virtual filesystem) Union 文件系统是 Docker 镜像的基础。 镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。
287 5
|
2月前
|
关系型数据库 MySQL 分布式数据库
阿里云PolarDB云原生数据库收费价格:MySQL和PostgreSQL详细介绍
阿里云PolarDB兼容MySQL、PostgreSQL及Oracle语法,支持集中式与分布式架构。标准版2核4G年费1116元起,企业版最高性能达4核16G,支持HTAP与多级高可用,广泛应用于金融、政务、互联网等领域,TCO成本降低50%。
|
2月前
|
关系型数据库 MySQL 数据库
阿里云数据库RDS费用价格:MySQL、SQL Server、PostgreSQL和MariaDB引擎收费标准
阿里云RDS数据库支持MySQL、SQL Server、PostgreSQL、MariaDB,多种引擎优惠上线!MySQL倚天版88元/年,SQL Server 2核4G仅299元/年,PostgreSQL 227元/年起。高可用、可弹性伸缩,安全稳定。详情见官网活动页。
|
2月前
|
SQL 关系型数据库 MySQL
Mysql数据恢复—Mysql数据库delete删除后数据恢复案例
本地服务器,操作系统为windows server。服务器上部署mysql单实例,innodb引擎,独立表空间。未进行数据库备份,未开启binlog。 人为误操作使用Delete命令删除数据时未添加where子句,导致全表数据被删除。删除后未对该表进行任何操作。需要恢复误删除的数据。 在本案例中的mysql数据库未进行备份,也未开启binlog日志,无法直接还原数据库。
|
2月前
|
存储 数据库 开发者
Python SQLite模块:轻量级数据库的实战指南
本文深入讲解Python内置sqlite3模块的实战应用,涵盖数据库连接、CRUD操作、事务管理、性能优化及高级特性,结合完整案例,助你快速掌握SQLite在小型项目中的高效使用,是Python开发者必备的轻量级数据库指南。
241 0
|
2月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
114 3
|
2月前
|
关系型数据库 MySQL 数据库
自建数据库如何迁移至RDS MySQL实例
数据库迁移是一项复杂且耗时的工程,需考虑数据安全、完整性及业务中断影响。使用阿里云数据传输服务DTS,可快速、平滑完成迁移任务,将应用停机时间降至分钟级。您还可通过全量备份自建数据库并恢复至RDS MySQL实例,实现间接迁移上云。
|
3月前
|
存储 运维 关系型数据库
从MySQL到云数据库,数据库迁移真的有必要吗?
本文探讨了企业在业务增长背景下,是否应从 MySQL 迁移至云数据库的决策问题。分析了 MySQL 的优势与瓶颈,对比了云数据库在存储计算分离、自动化运维、多负载支持等方面的优势,并提出判断迁移必要性的五个关键问题及实施路径,帮助企业理性决策并落地迁移方案。
|
2月前
|
关系型数据库 分布式数据库 数据库
阿里云数据库收费价格:MySQL、PostgreSQL、SQL Server和MariaDB引擎费用整理
阿里云数据库提供多种类型,包括关系型与NoSQL,主流如PolarDB、RDS MySQL/PostgreSQL、Redis等。价格低至21元/月起,支持按需付费与优惠套餐,适用于各类应用场景。

热门文章

最新文章

推荐镜像

更多