【SQL应知应会】表分区(五)• MySQL版

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 【SQL应知应会】表分区(五)• MySQL版

前言

在前面的内容中,✅【SQL应知应会】表分区(一)• MySQL版、✅【SQL应知应会】表分区(二)• MySQL版、✅【SQL应知应会】表分区(三)• MySQL版以及✅【SQL应知应会】表分区(四)• MySQL版中,已经完成了MySQL的表分区方面的大部分知识的学习

🆗今天这篇内容,将继续进行讲述MySQL的表分区的后续内容,主要包括 MySQL分区处理null值的方式、获取分区表信息的方法、分区表与非分区表的性能对比和分区的使用场景

希望文章的内容对大家有所帮助,如果有什么不足的地方,大家可以在评论区或者私信我,感谢大家的支持

💻那么,快拿出你的电脑,跟着文章一起学习起来吧


一、分区表

1.非分区表

👉:传送门💖非分区表构💖


2.分区表

2.1 概念

👉:传送门💖概念💖


2.2 MySQL数据库表分区

2.2.1 InnoDB 逻辑存储结构

👉:传送门💖InnoDB 逻辑存储结构💖


2.2.2 段(segment)

2.2.3 区(extent)

2.2.4 页(page)


2.3 MySQL数据库分区的由来

👉:传送门💖MySQL数据库分区的由来💖


2.4 为什么对表进行分区?

👉:传送门💖为什么对表进行分区💖


2.4.1 表分区要解决的问题

2.4.2 表分区有如下优点


2.5 MySQL的分区形式

👉:传送门💖MySQL的分区形式💖


2.5.1 水平分区(HorizontalPartitioning)

2.5.2 垂直分区(VerticalPartitioning)


2.6 MySQL分区的类型

2.6.1 range分区 👉:传送门💖range分区💖

2.6.2 list分区(列表分区)

2.6.3 hash分区

2.6.4 KEY表分区

2.6.5 多字段分区(range、list)

2.6.6 分区注意事项及适用场景


2.7 MySQL分区代码

2.7.1range分区

2.7.2list分区

👉:传送门💖2.7.1~ 2.7.2💖

2.7.3 hash表分区

2.7.4 key表分区

2.7.5复合分区

2.7.5.1 range-hash(范围哈希)复合分区

2.7.5.2 list-hash(列表哈希)复合分区

👉:传送门💖2.7.3 ~ 2.7.5💖

2.7.5.3 range-key 复合分区

2.7.5.4 list - key 复合分区

👉:传送门💖2.7.5.3 ~ 2.7.5.4💖


2.8 常见分区操作

👉:传送门💖常见分区操作💖


2.8.1 删除分区

2.8.2 增加分区

2.8.3 分解分区

2.8.4 合并分区

2.8.5 重新定义分区

2.8.6 重建分区

2.8.7 检查分区

2.8.8 修补分区


2.9 MySQL分区表的局限性

👉:传送门💖MySQL分区表的局限性💖


2.9.1 错误示例

2.9.2 错误修正


2.10 MySQL分区处理null值的方式

如果分区键所在列没有not null约束

如果是range分区表,那么null行将被保存在范围最小的分区。

如果是list分区表,那么null行将被保存到1ist为0的分区。

在按HASH和KEY分区的情况下,任何产生NULL值的表达式mysql都视同它的返回值为0.

为了避免上述这种情况的产生,建议分区键设置成NOT MULL。


分区键必须是INT类型,或者通过表达式返回INT类型,可以为NULL

唯一的例外是当分区类型为KEY分区的时候,可以使用其他类型的列作为分区键(BLOB or TEXT列除外)

对分区表的分区键创建索引,那么这个索引也将被分区,分区键没有全局索引一说

只有RANGE和LIST分区能进行子分区,HASH和KEY分区不能进行子分区。

临时表不能被分区

2.11 获取分区表信息的方法

2.11.1 查看创建分区表的create语句

## show create table 表名
show create table foo_list


2.11.2 查看表是否是分区表

show table status like 'foo_range'


2.11.3 查看information_schema.partition表

该表提供分区表相关的信息,每一行都关联一个独立的分区或者子分区

TABLE_SCHEMA : 分区表所在的数据库名称
TABLE_NAME : 分区表的名称
PARTITION_NAME : 分区的名称
SUBPARTITION_NAME : 子分区的名称
PARTITION_ORDINAL_POSITION : 分区在表中的位置,从1开始,会在分区添加,删除,重整使会发生编号
SUBPARTITION_ORDINAL_POSITION : 子分区在分区中的位置
PARTITION_METHOD : 分区类型,可以是RANGE,LIST,HASH,LINEAR HASH,KEY,or LINEAR KEY
SUBPARTITION_METHOD : 子分区的类型,可以是HASH,LINEAR HASH,KEY,or LINEAR KEY
PARTITION_EXPRESSION : 分区表达式信息,如PARTITION BY HASH(c1+c2)语句
PARTITION_DESCRIPTION : RANGE and LIST分区时有用,显示相关的定义信息,其他的类型值为NULL
CREATE_TIME : 建立的时间
UPDATE_TIME : 最后修改时间
PARTITION_COMMENT : 注释信息


2.11.4 查看表具有哪几个分区,分区的方法,分区中数据的记录数等信息

select 
  partition_name part,
  partition_expression expr,
  partition_description descr,
  table_rows
from information_schema.partitions 
where table_schema = schema()
and table_name = 'foo_range'


2.11.5 显示扫描哪些分区及它们是如何使用的

explain partitions select语句


3.性能对比(分区表和非分区表)

3.1步骤1:创建两张表 part_tab(分区表),no_part_tab(普通表)

create table part_tab
(
    c1 int default null,
    c2 varchar(30) default null,
    c3 date not null
)
partition by range(year(c3))
( 
    partition p0 values less than (1995),
    partition p1 values less than (1996),
    partition p2 values less than (1997),
    partition p3 values less than (1998),
    partition p4 values less than (1999),
    partition p5 values less than (2000),
    partition p6 values less than (2001),
    partition p7 values less than (2002),
    partition p8 values less than (2003),
    partition p9 values less than (2004),
    partition p10 values less than (2010),
    partition p11 values less than (maxvalue)
)
create table no_part_tab
(
    c1 int default null,
    c2 varchar(30) default null,
    c3 date not null
)


3.2 步骤2:存储过程

3.2.1 创建存储过程

create procedure load_part_tab()
  begin
  declare v in default 0;
  while v < 8000000
  do
  insert into part_tab
  values(v,'testingpartitions',adddate('1995-01-01',(rand(v)*36520)mod 3652))
  set v = v + 1;
  end while;
end;


3.2.2 调用存储过程,插入数据

call load_part_tab();


3.2.3 导数据

从part_tab 导入数据到 no_part_tab

insert into no_part_tab select * from part_tab


3.3 步骤3: 进行对比

3.3.1 执行查询速度对比

select count(*) from part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';
select count(*) from no_part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';

3.3.2 扫描次数对比

explain
select count(*) from part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';
explain
select count(*) from no_part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';

4. 分区使用场景

当数据量很大(过T)时,肯定不能把数据再如到内存中,这样查询一个或一定范围的item是很耗时。另外一般这情况下,历史数据或不常访问的数据占很大部分,最新或热点数据占的比例不是很大。这时可以根据有些条件进行表分区。

分区表的更易管理,比如删除过去某一时间的历史数据,直接执行truncate,或者狠点drop整个分区,这比detele删除效率更高

当数据量很大,或者将来很大的,但单块磁盘的容量不够,或者想提升I0效率的时候,可以把没分区中的子分区挂载到不同的磁盘上。

使用分区表可避免某些特殊的瓶颈,例如Innodb的单个索引的互斥访问…

在某些场景下,单个分区表的备份很恢复会更有效率

总结: 可伸缩性,可管理性,提高数据库查询效率。


小结

🎉 🎉 🎉感谢大家耐心的看完这篇文章,对于SQL在表分区的知识点,我们在MySQL方面已经有五篇内容了,而我们对于MySQL的分区通过这五篇内容也终于可以✅告一段落了

如果大家觉着还算可以,那么就给个三连支持一下吧,如果想要继续关注和学习后续更多的内容,就关注一下👨爱书不爱输的程序猿吧,当然,如果大家还有什么其他方面的知识点想要看,可以在评论区或者私信我


相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
10天前
|
SQL 存储 关系型数据库
【MySQL基础篇】全面学习总结SQL语法、DataGrip安装教程
本文详细介绍了MySQL中的SQL语法,包括数据定义(DDL)、数据操作(DML)、数据查询(DQL)和数据控制(DCL)四个主要部分。内容涵盖了创建、修改和删除数据库、表以及表字段的操作,以及通过图形化工具DataGrip进行数据库管理和查询。此外,还讲解了数据的增、删、改、查操作,以及查询语句的条件、聚合函数、分组、排序和分页等知识点。
【MySQL基础篇】全面学习总结SQL语法、DataGrip安装教程
|
28天前
|
SQL 存储 缓存
MySQL进阶突击系列(02)一条更新SQL执行过程 | 讲透undoLog、redoLog、binLog日志三宝
本文详细介绍了MySQL中update SQL执行过程涉及的undoLog、redoLog和binLog三种日志的作用及其工作原理,包括它们如何确保数据的一致性和完整性,以及在事务提交过程中各自的角色。同时,文章还探讨了这些日志在故障恢复中的重要性,强调了合理配置相关参数对于提高系统稳定性的必要性。
|
26天前
|
SQL 关系型数据库 MySQL
MySQL 高级(进阶) SQL 语句
MySQL 提供了丰富的高级 SQL 语句功能,能够处理复杂的数据查询和管理需求。通过掌握窗口函数、子查询、联合查询、复杂连接操作和事务处理等高级技术,能够大幅提升数据库操作的效率和灵活性。在实际应用中,合理使用这些高级功能,可以更高效地管理和查询数据,满足多样化的业务需求。
104 3
|
29天前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
|
1月前
|
SQL 存储 关系型数据库
MySQL进阶突击系列(01)一条简单SQL搞懂MySQL架构原理 | 含实用命令参数集
本文从MySQL的架构原理出发,详细介绍其SQL查询的全过程,涵盖客户端发起SQL查询、服务端SQL接口、解析器、优化器、存储引擎及日志数据等内容。同时提供了MySQL常用的管理命令参数集,帮助读者深入了解MySQL的技术细节和优化方法。
|
SQL 存储 关系型数据库
MySQL下使用SQL命令进行表结构与数据复制实践
MySQL下使用SQL命令进行表结构与数据复制实践
164 0
|
SQL 关系型数据库 MySQL
MySQl数据库第八课-------SQL命令查询-------主要命脉2
MySQl数据库第八课-------SQL命令查询-------主要命脉
|
SQL 关系型数据库 MySQL
MySQl数据库第八课-------SQL命令查询-------主要命脉 1
MySQl数据库第八课-------SQL命令查询-------主要命脉
122 0
|
SQL 存储 开发框架
MySQl数据库第六课-------SQl命令的延续------快来看看
MySQl数据库第六课-------SQl命令的延续------快来看看
|
SQL 存储 NoSQL
MySQl数据库第五课 --------在SQl的简单命令--------学习学习
MySQl数据库第五课 --------在SQl的简单命令--------学习学习