【SQL应知应会】表分区(五)• MySQL版

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: 【SQL应知应会】表分区(五)• MySQL版

前言

在前面的内容中,✅【SQL应知应会】表分区(一)• MySQL版、✅【SQL应知应会】表分区(二)• MySQL版、✅【SQL应知应会】表分区(三)• MySQL版以及✅【SQL应知应会】表分区(四)• MySQL版中,已经完成了MySQL的表分区方面的大部分知识的学习

🆗今天这篇内容,将继续进行讲述MySQL的表分区的后续内容,主要包括 MySQL分区处理null值的方式、获取分区表信息的方法、分区表与非分区表的性能对比和分区的使用场景

希望文章的内容对大家有所帮助,如果有什么不足的地方,大家可以在评论区或者私信我,感谢大家的支持

💻那么,快拿出你的电脑,跟着文章一起学习起来吧


一、分区表

1.非分区表

👉:传送门💖非分区表构💖


2.分区表

2.1 概念

👉:传送门💖概念💖


2.2 MySQL数据库表分区

2.2.1 InnoDB 逻辑存储结构

👉:传送门💖InnoDB 逻辑存储结构💖


2.2.2 段(segment)

2.2.3 区(extent)

2.2.4 页(page)


2.3 MySQL数据库分区的由来

👉:传送门💖MySQL数据库分区的由来💖


2.4 为什么对表进行分区?

👉:传送门💖为什么对表进行分区💖


2.4.1 表分区要解决的问题

2.4.2 表分区有如下优点


2.5 MySQL的分区形式

👉:传送门💖MySQL的分区形式💖


2.5.1 水平分区(HorizontalPartitioning)

2.5.2 垂直分区(VerticalPartitioning)


2.6 MySQL分区的类型

2.6.1 range分区 👉:传送门💖range分区💖

2.6.2 list分区(列表分区)

2.6.3 hash分区

2.6.4 KEY表分区

2.6.5 多字段分区(range、list)

2.6.6 分区注意事项及适用场景


2.7 MySQL分区代码

2.7.1range分区

2.7.2list分区

👉:传送门💖2.7.1~ 2.7.2💖

2.7.3 hash表分区

2.7.4 key表分区

2.7.5复合分区

2.7.5.1 range-hash(范围哈希)复合分区

2.7.5.2 list-hash(列表哈希)复合分区

👉:传送门💖2.7.3 ~ 2.7.5💖

2.7.5.3 range-key 复合分区

2.7.5.4 list - key 复合分区

👉:传送门💖2.7.5.3 ~ 2.7.5.4💖


2.8 常见分区操作

👉:传送门💖常见分区操作💖


2.8.1 删除分区

2.8.2 增加分区

2.8.3 分解分区

2.8.4 合并分区

2.8.5 重新定义分区

2.8.6 重建分区

2.8.7 检查分区

2.8.8 修补分区


2.9 MySQL分区表的局限性

👉:传送门💖MySQL分区表的局限性💖


2.9.1 错误示例

2.9.2 错误修正


2.10 MySQL分区处理null值的方式

如果分区键所在列没有not null约束

如果是range分区表,那么null行将被保存在范围最小的分区。

如果是list分区表,那么null行将被保存到1ist为0的分区。

在按HASH和KEY分区的情况下,任何产生NULL值的表达式mysql都视同它的返回值为0.

为了避免上述这种情况的产生,建议分区键设置成NOT MULL。


分区键必须是INT类型,或者通过表达式返回INT类型,可以为NULL

唯一的例外是当分区类型为KEY分区的时候,可以使用其他类型的列作为分区键(BLOB or TEXT列除外)

对分区表的分区键创建索引,那么这个索引也将被分区,分区键没有全局索引一说

只有RANGE和LIST分区能进行子分区,HASH和KEY分区不能进行子分区。

临时表不能被分区

2.11 获取分区表信息的方法

2.11.1 查看创建分区表的create语句

## show create table 表名
show create table foo_list


2.11.2 查看表是否是分区表

show table status like 'foo_range'


2.11.3 查看information_schema.partition表

该表提供分区表相关的信息,每一行都关联一个独立的分区或者子分区

TABLE_SCHEMA : 分区表所在的数据库名称
TABLE_NAME : 分区表的名称
PARTITION_NAME : 分区的名称
SUBPARTITION_NAME : 子分区的名称
PARTITION_ORDINAL_POSITION : 分区在表中的位置,从1开始,会在分区添加,删除,重整使会发生编号
SUBPARTITION_ORDINAL_POSITION : 子分区在分区中的位置
PARTITION_METHOD : 分区类型,可以是RANGE,LIST,HASH,LINEAR HASH,KEY,or LINEAR KEY
SUBPARTITION_METHOD : 子分区的类型,可以是HASH,LINEAR HASH,KEY,or LINEAR KEY
PARTITION_EXPRESSION : 分区表达式信息,如PARTITION BY HASH(c1+c2)语句
PARTITION_DESCRIPTION : RANGE and LIST分区时有用,显示相关的定义信息,其他的类型值为NULL
CREATE_TIME : 建立的时间
UPDATE_TIME : 最后修改时间
PARTITION_COMMENT : 注释信息


2.11.4 查看表具有哪几个分区,分区的方法,分区中数据的记录数等信息

select 
  partition_name part,
  partition_expression expr,
  partition_description descr,
  table_rows
from information_schema.partitions 
where table_schema = schema()
and table_name = 'foo_range'


2.11.5 显示扫描哪些分区及它们是如何使用的

explain partitions select语句


3.性能对比(分区表和非分区表)

3.1步骤1:创建两张表 part_tab(分区表),no_part_tab(普通表)

create table part_tab
(
    c1 int default null,
    c2 varchar(30) default null,
    c3 date not null
)
partition by range(year(c3))
( 
    partition p0 values less than (1995),
    partition p1 values less than (1996),
    partition p2 values less than (1997),
    partition p3 values less than (1998),
    partition p4 values less than (1999),
    partition p5 values less than (2000),
    partition p6 values less than (2001),
    partition p7 values less than (2002),
    partition p8 values less than (2003),
    partition p9 values less than (2004),
    partition p10 values less than (2010),
    partition p11 values less than (maxvalue)
)
create table no_part_tab
(
    c1 int default null,
    c2 varchar(30) default null,
    c3 date not null
)


3.2 步骤2:存储过程

3.2.1 创建存储过程

create procedure load_part_tab()
  begin
  declare v in default 0;
  while v < 8000000
  do
  insert into part_tab
  values(v,'testingpartitions',adddate('1995-01-01',(rand(v)*36520)mod 3652))
  set v = v + 1;
  end while;
end;


3.2.2 调用存储过程,插入数据

call load_part_tab();


3.2.3 导数据

从part_tab 导入数据到 no_part_tab

insert into no_part_tab select * from part_tab


3.3 步骤3: 进行对比

3.3.1 执行查询速度对比

select count(*) from part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';
select count(*) from no_part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';

3.3.2 扫描次数对比

explain
select count(*) from part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';
explain
select count(*) from no_part_tab 
where c3 > date '1995-01-01'
and c3 < date '1995-12-31';

4. 分区使用场景

当数据量很大(过T)时,肯定不能把数据再如到内存中,这样查询一个或一定范围的item是很耗时。另外一般这情况下,历史数据或不常访问的数据占很大部分,最新或热点数据占的比例不是很大。这时可以根据有些条件进行表分区。

分区表的更易管理,比如删除过去某一时间的历史数据,直接执行truncate,或者狠点drop整个分区,这比detele删除效率更高

当数据量很大,或者将来很大的,但单块磁盘的容量不够,或者想提升I0效率的时候,可以把没分区中的子分区挂载到不同的磁盘上。

使用分区表可避免某些特殊的瓶颈,例如Innodb的单个索引的互斥访问…

在某些场景下,单个分区表的备份很恢复会更有效率

总结: 可伸缩性,可管理性,提高数据库查询效率。


小结

🎉 🎉 🎉感谢大家耐心的看完这篇文章,对于SQL在表分区的知识点,我们在MySQL方面已经有五篇内容了,而我们对于MySQL的分区通过这五篇内容也终于可以✅告一段落了

如果大家觉着还算可以,那么就给个三连支持一下吧,如果想要继续关注和学习后续更多的内容,就关注一下👨爱书不爱输的程序猿吧,当然,如果大家还有什么其他方面的知识点想要看,可以在评论区或者私信我


相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
26天前
|
SQL 关系型数据库 MySQL
mysql一条sql查询出多个统计结果
mysql一条sql查询出多个统计结果
15 0
|
1天前
|
SQL 关系型数据库 MySQL
【MySQL】SQL优化
【MySQL】SQL优化
|
12天前
|
SQL 关系型数据库 数据库
【后端面经】【数据库与MySQL】SQL优化:如何发现SQL中的问题?
【4月更文挑战第12天】数据库优化涉及硬件升级、操作系统调整、服务器/引擎优化和SQL优化。SQL优化目标是减少磁盘IO和内存/CPU消耗。`EXPLAIN`命令用于检查SQL执行计划,关注`type`、`possible_keys`、`key`、`rows`和`filtered`字段。设计索引时考虑外键、频繁出现在`where`、`order by`和关联查询中的列,以及区分度高的列。大数据表改结构需谨慎,可能需要停机、低峰期变更或新建表。面试中应准备SQL优化案例,如覆盖索引、优化`order by`、`count`和索引提示。优化分页查询时避免大偏移量,可利用上一批的最大ID进行限制。
39 3
|
19天前
|
SQL 存储 关系型数据库
【MySQL实战笔记】02.一条SQL更新语句是如何执行的-2
【4月更文挑战第5天】两阶段提交是为确保`redo log`和`binlog`逻辑一致,避免数据不一致。若先写`redo log`, crash后数据可能丢失,导致恢复后状态错误;若先写`binlog`,crash则可能导致重复事务,影响数据库一致性。一天一备相较于一周一备,能缩短“最长恢复时间”,但需权衡额外的存储成本。
16 1
|
26天前
|
SQL 关系型数据库 MySQL
【MySQL】慢SQL分析流程
【4月更文挑战第1天】【MySQL】慢SQL分析流程
|
29天前
|
SQL 关系型数据库 MySQL
【MySQL技术之旅】(7)总结和盘点优化方案系列之常用SQL的优化
【MySQL技术之旅】(7)总结和盘点优化方案系列之常用SQL的优化
42 1
|
4天前
|
SQL 存储 关系型数据库
MySQL Cluster集群安装及使用
MySQL Cluster集群安装及使用
|
19天前
|
关系型数据库 MySQL 数据库
mysql卸载、下载、安装(window版本)
mysql卸载、下载、安装(window版本)
|
8天前
|
关系型数据库 MySQL 数据库
《MySQL 简易速速上手小册》第1章:MySQL 基础和安装(2024 最新版)
《MySQL 简易速速上手小册》第1章:MySQL 基础和安装(2024 最新版)
35 4
|
2天前
|
关系型数据库 MySQL 数据安全/隐私保护
安装mysql和远程连接
安装mysql和远程连接
12 0