【SQL应知应会】表分区(五)• MySQL版

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 【SQL应知应会】表分区(五)• MySQL版

前言

在前面的内容中,✅【SQL应知应会】表分区(一)• MySQL版、✅【SQL应知应会】表分区(二)• MySQL版、✅【SQL应知应会】表分区(三)• MySQL版以及✅【SQL应知应会】表分区(四)• MySQL版中,已经完成了MySQL的表分区方面的大部分知识的学习

🆗今天这篇内容,将继续进行讲述MySQL的表分区的后续内容,主要包括 MySQL分区处理null值的方式、获取分区表信息的方法、分区表与非分区表的性能对比和分区的使用场景

希望文章的内容对大家有所帮助,如果有什么不足的地方,大家可以在评论区或者私信我,感谢大家的支持

💻那么,快拿出你的电脑,跟着文章一起学习起来吧


一、分区表

1.非分区表

👉:传送门💖非分区表构💖


2.分区表

2.1 概念

👉:传送门💖概念💖


2.2 MySQL数据库表分区

2.2.1 InnoDB 逻辑存储结构

👉:传送门💖InnoDB 逻辑存储结构💖


2.2.2 段(segment)

2.2.3 区(extent)

2.2.4 页(page)


2.3 MySQL数据库分区的由来

👉:传送门💖MySQL数据库分区的由来💖


2.4 为什么对表进行分区?

👉:传送门💖为什么对表进行分区💖


2.4.1 表分区要解决的问题

2.4.2 表分区有如下优点


2.5 MySQL的分区形式

👉:传送门💖MySQL的分区形式💖


2.5.1 水平分区(HorizontalPartitioning)

2.5.2 垂直分区(VerticalPartitioning)


2.6 MySQL分区的类型

2.6.1 range分区 👉:传送门💖range分区💖

2.6.2 list分区(列表分区)

2.6.3 hash分区

2.6.4 KEY表分区

2.6.5 多字段分区(range、list)

2.6.6 分区注意事项及适用场景


2.7 MySQL分区代码

2.7.1range分区

2.7.2list分区

👉:传送门💖2.7.1~ 2.7.2💖

2.7.3 hash表分区

2.7.4 key表分区

2.7.5复合分区

2.7.5.1 range-hash(范围哈希)复合分区

2.7.5.2 list-hash(列表哈希)复合分区

👉:传送门💖2.7.3 ~ 2.7.5💖

2.7.5.3 range-key 复合分区

2.7.5.4 list - key 复合分区

👉:传送门💖2.7.5.3 ~ 2.7.5.4💖


2.8 常见分区操作

👉:传送门💖常见分区操作💖


2.8.1 删除分区

2.8.2 增加分区

2.8.3 分解分区

2.8.4 合并分区

2.8.5 重新定义分区

2.8.6 重建分区

2.8.7 检查分区

2.8.8 修补分区


2.9 MySQL分区表的局限性

👉:传送门💖MySQL分区表的局限性💖


2.9.1 错误示例

2.9.2 错误修正


2.10 MySQL分区处理null值的方式

如果分区键所在列没有not null约束

如果是range分区表,那么null行将被保存在范围最小的分区。

如果是list分区表,那么null行将被保存到1ist为0的分区。

在按HASH和KEY分区的情况下,任何产生NULL值的表达式mysql都视同它的返回值为0.

为了避免上述这种情况的产生,建议分区键设置成NOT MULL。


分区键必须是INT类型,或者通过表达式返回INT类型,可以为NULL

唯一的例外是当分区类型为KEY分区的时候,可以使用其他类型的列作为分区键(BLOB or TEXT列除外)

对分区表的分区键创建索引,那么这个索引也将被分区,分区键没有全局索引一说

只有RANGE和LIST分区能进行子分区,HASH和KEY分区不能进行子分区。

临时表不能被分区

2.11 获取分区表信息的方法

2.11.1 查看创建分区表的create语句

## show create table 表名
show create table foo_list


2.11.2 查看表是否是分区表

show table status like 'foo_range'


2.11.3 查看information_schema.partition表

该表提供分区表相关的信息,每一行都关联一个独立的分区或者子分区

TABLE_SCHEMA : 分区表所在的数据库名称
TABLE_NAME : 分区表的名称
PARTITION_NAME : 分区的名称
SUBPARTITION_NAME : 子分区的名称
PARTITION_ORDINAL_POSITION : 分区在表中的位置,从1开始,会在分区添加,删除,重整使会发生编号
SUBPARTITION_ORDINAL_POSITION : 子分区在分区中的位置
PARTITION_METHOD : 分区类型,可以是RANGE,LIST,HASH,LINEAR HASH,KEY,or LINEAR KEY
SUBPARTITION_METHOD : 子分区的类型,可以是HASH,LINEAR HASH,KEY,or LINEAR KEY
PARTITION_EXPRESSION : 分区表达式信息,如PARTITION BY HASH(c1+c2)语句
PARTITION_DESCRIPTION : RANGE and LIST分区时有用,显示相关的定义信息,其他的类型值为NULL
CREATE_TIME : 建立的时间
UPDATE_TIME : 最后修改时间
PARTITION_COMMENT : 注释信息


2.11.4 查看表具有哪几个分区,分区的方法,分区中数据的记录数等信息

select 
  partition_name part,
  partition_expression expr,
  partition_description descr,
  table_rows
from information_schema.partitions 
where table_schema = schema()
and table_name = 'foo_range'


2.11.5 显示扫描哪些分区及它们是如何使用的

explain partitions select语句


3.性能对比(分区表和非分区表)

3.1步骤1:创建两张表 part_tab(分区表),no_part_tab(普通表)

create table part_tab
(
    c1 int default null,
    c2 varchar(30) default null,
    c3 date not null
)
partition by range(year(c3))
( 
    partition p0 values less than (1995),
    partition p1 values less than (1996),
    partition p2 values less than (1997),
    partition p3 values less than (1998),
    partition p4 values less than (1999),
    partition p5 values less than (2000),
    partition p6 values less than (2001),
    partition p7 values less than (2002),
    partition p8 values less than (2003),
    partition p9 values less than (2004),
    partition p10 values less than (2010),
    partition p11 values less than (maxvalue)
)
create table no_part_tab
(
    c1 int default null,
    c2 varchar(30) default null,
    c3 date not null
)


3.2 步骤2:存储过程

3.2.1 创建存储过程

create procedure load_part_tab()
  begin
  declare v in default 0;
  while v < 8000000
  do
  insert into part_tab
  values(v,'testingpartitions',adddate('1995-01-01',(rand(v)*36520)mod 3652))
  set v = v + 1;
  end while;
end;


3.2.2 调用存储过程,插入数据

call load_part_tab();


3.2.3 导数据

从part_tab 导入数据到 no_part_tab

insert into no_part_tab select * from part_tab


3.3 步骤3: 进行对比

3.3.1 执行查询速度对比

select count(*) from part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';
select count(*) from no_part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';

3.3.2 扫描次数对比

explain
select count(*) from part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';
explain
select count(*) from no_part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';

4. 分区使用场景

当数据量很大(过T)时,肯定不能把数据再如到内存中,这样查询一个或一定范围的item是很耗时。另外一般这情况下,历史数据或不常访问的数据占很大部分,最新或热点数据占的比例不是很大。这时可以根据有些条件进行表分区。

分区表的更易管理,比如删除过去某一时间的历史数据,直接执行truncate,或者狠点drop整个分区,这比detele删除效率更高

当数据量很大,或者将来很大的,但单块磁盘的容量不够,或者想提升I0效率的时候,可以把没分区中的子分区挂载到不同的磁盘上。

使用分区表可避免某些特殊的瓶颈,例如Innodb的单个索引的互斥访问…

在某些场景下,单个分区表的备份很恢复会更有效率

总结: 可伸缩性,可管理性,提高数据库查询效率。


小结

🎉 🎉 🎉感谢大家耐心的看完这篇文章,对于SQL在表分区的知识点,我们在MySQL方面已经有五篇内容了,而我们对于MySQL的分区通过这五篇内容也终于可以✅告一段落了

如果大家觉着还算可以,那么就给个三连支持一下吧,如果想要继续关注和学习后续更多的内容,就关注一下👨爱书不爱输的程序猿吧,当然,如果大家还有什么其他方面的知识点想要看,可以在评论区或者私信我


相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1月前
|
SQL 运维 关系型数据库
MySQL 运维 SQL 备忘
MySQL 运维 SQL 备忘录
46 1
|
22天前
|
SQL 关系型数据库 MySQL
MySql5.6版本开启慢SQL功能-本次采用永久生效方式
MySql5.6版本开启慢SQL功能-本次采用永久生效方式
33 0
|
22天前
|
SQL 关系型数据库 MySQL
mysql编写sql脚本:要求表没有主键,但是想查询没有相同值的时候才进行插入
mysql编写sql脚本:要求表没有主键,但是想查询没有相同值的时候才进行插入
31 0
|
1月前
|
SQL 存储 关系型数据库
mysql 数据库空间统计sql
mysql 数据库空间统计sql
46 0
|
2月前
|
关系型数据库 MySQL 网络安全
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
5-10Can't connect to MySQL server on 'sh-cynosl-grp-fcs50xoa.sql.tencentcdb.com' (110)")
|
4月前
|
SQL 存储 监控
SQL Server的并行实施如何优化?
【7月更文挑战第23天】SQL Server的并行实施如何优化?
114 13
|
4月前
|
SQL
解锁 SQL Server 2022的时间序列数据功能
【7月更文挑战第14天】要解锁SQL Server 2022的时间序列数据功能,可使用`generate_series`函数生成整数序列,例如:`SELECT value FROM generate_series(1, 10)。此外,`date_bucket`函数能按指定间隔(如周)对日期时间值分组,这些工具结合窗口函数和其他时间日期函数,能高效处理和分析时间序列数据。更多信息请参考官方文档和技术资料。
|
4月前
|
SQL 存储 网络安全
关系数据库SQLserver 安装 SQL Server
【7月更文挑战第26天】
61 6
|
4月前
|
存储 SQL C++
对比 SQL Server中的VARCHAR(max) 与VARCHAR(n) 数据类型
【7月更文挑战7天】SQL Server 中的 VARCHAR(max) vs VARCHAR(n): - VARCHAR(n) 存储最多 n 个字符(1-8000),适合短文本。 - VARCHAR(max) 可存储约 21 亿个字符,适合大量文本。 - VARCHAR(n) 在处理小数据时性能更好,空间固定。 - VARCHAR(max) 对于大文本更合适,但可能影响性能。 - 选择取决于数据长度预期和业务需求。
380 1
|
3月前
|
SQL 安全 Java
驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接。错误:“The server selected protocol version TLS10 is not accepted by client
驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接。错误:“The server selected protocol version TLS10 is not accepted by client
477 0